原创不易,且行且珍惜”
01
—
前言
以下摘自百度百科:
人工智能(Artificial Intelligence),英文缩写为AI。是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
AI从最初的40、50年代的神经元数学模型模拟人脑神经活动,也即神经网络和深度学习的源头,到后来的机器学习、语音识别、推荐算法、搜索等,再到最近的深度学习革命(AlphaGo阿尔法围棋战胜人类世界围棋冠军),大语言模型/AIGC全面爆发。
2026年如今AI几乎在进入各行各业,普通人掌握最基本的AI技术知识是拉开与其他未掌握AI技术差距的最快捷途径。掌握以下这些常用的AI工具,可以让我们日常的工作和生活事半功倍。
三、大模型
大语言模型简称:大模型(Large Language Model, LLM),通常指参数规模庞大(通常在十亿到万亿级别)的深度学习模型。这类模型通过在大规模数据集上进行训练,具备强大的泛化能力和复杂的任务处理能力,尤其在自然语言处理(NLP)、计算机视觉(CV)和多模态任务中表现突出。

语言大模型(NLP):是指在自然语言处理(Natural Language Processing,NLP)领域中的一类大模型,通常用于处理文本数据和理解自然语言。这类大模型的主要特点是它们在大规模语料库上进行了训练,以学习自然语言的各种语法、语义和语境规则。例如:GPT系列(OpenAI)、Bard(Google)、文心一言(百度)。
视觉大模型(CV):是指在计算机视觉(Computer Vision,CV)领域中使用的大模型,通常用于图像处理和分析。这类模型通过在大规模图像数据上进行训练,可以实现各种视觉任务,如图像分类、目标检测、图像分割、姿态估计、人脸识别等。例如:VIT 系列(Google)、文心UFO、华为盘古 CV、INTERN(商汤)。
多模态大模型:是指能够处理多种不同类型数据的大模型,例如文本、图像、音频等多模态数据。这类模型结合了 NLP 和 CV 的能力,以实现对多模态信息的综合理解和分析,从而能够更全面地理解和处理复杂的数据。例如:DingoDB 多模向量数据库(九章云极 DataCanvas)、DALL-E(OpenAI)、悟空画画(华为)、midjourney。
02
—
主流大模型
https://openai.com/zh-Hans-CN/index/introducing-gpt-5-2/

2、Google Gemini 3 系列(Pro/Flash)
https://www.gemini3.com/


https://bailian.console.aliyun.com/

https://www.doubao.com/

https://chat.deepseek.com/

https://claude.com/app-unavailable-in-region

03
—
AI绘画和视频
1、即梦AI
即梦AI是由字节跳动旗下剪映团队于2024年3月开启内测的生成式人工智能创作平台,原名为剪映Dreamina,2024年5月正式定名为中文品牌"即梦"。一站式AI创作平台,包含文生图、图生图、文生视频及图生视频等功能,2026年2月,平台接入视频生成模型Seedance2.0,支持图像、视频、音频、文本四种模态混合输入及15秒视频生成。
https://jimeng.jianying.com/ai-tool/home

2、Nano Banana Pro
Google于2025年11月发布的专业级AI图像生成与编辑平台,底层基于Gemini 3 Pro Image多模态大模型,是标准版Nano Banana(Gemini 2.5 Flash)的旗舰升级版本,面向设计师、营销团队与商业印刷场景.
平台有好几个网站可供使用:
https://nano-bananapro.org/zh https://nanobanana-pro.com/


3、可灵AI
快手自研的AI视频生成大模型,主打文生视频、图生视频、数字人、音画同步,是国内主流的AI 视频创作工具,以视频为主,中文/口型/运镜强,长视频,性价比高,适合内容创作。
https://app.klingai.com/cn/

4、Veo3.1
Veo 3.1是谷歌于2025年10月16日推出的旗舰级AI视频生成模型,主打电影级画质、原生音画同步、强叙事控制与长视频能力,集成在Flow平台、Gemini API、Vertex AI中,面向专业创作者与企业级应用。
https://veo3spsc.wzrenkj.cn/h5/veovideo/i.html

5、悟空AI(数字人)
字节跳动与香港大学联合研发的Goku视频生成模型(含商业强化版 Goku+),主打超写实数字人视频生成与电商带货场景(数字人带货)。网红数字人生成的绝佳工具,解决视频生成常见的闪烁、断层问题,生成效率更高。直接对接电商场景,输入产品图和文案即可生成可用于抖音、视频号等平台的带货素材,极大提升内容生产效率。
https://goku-ai.org/zh/image-to-video

6、Midjourney
全球最主流、画质最强的AI绘画工具之一,只做图像,不做视频。核心优势:高清大图,支持 4K、放大、局部重绘。
https://mid.mjdraw.cn/home/


7、Stable Diffusion
Stability AI于2022年推出的开源潜在扩散模型,主打文生图、图生图、图像编辑,Stable Diffusion是一款开源免费,可本地部署、可魔改、可商用;目前最流行、最自由、本地可跑的开源AI画图框架。
https://stablediffusionchina.com/


8、智谱清影
智谱清影是智谱AI(智谱清言)推出的AI视频生成工具,基于自研CogVideoX模型,主打文生视频、图生视频,可快速生成4K/60 帧、10秒高清视频,支持配音与音效,适合短视频、广告、内容创作。
https://chatglm.cn/video?lang=zh

04
—
AI应用办公
1、腾讯IMA(知识库)
腾讯官方AI智能工作台,主打「个人 / 团队知识库 + AI 问答 + 智能创作 + 任务执行」,定位为你的「第二大脑」。腾讯生态 + 双模型 + 知识库 + 任务执行,免费基础版可用。
https://ima.qq.com/

2、NotebookLM
Google推出的专业AI研究助理,基于Gemini引擎,主打严格溯源的RAG问答与深度文献分析,是学术研究、报告撰写和知识深挖的利器。以 “笔记本”为单位,做有据可查的研究与写作,彻底解决 AI幻觉问题。支持PPTX导出、提示词引导修改、数据表格分析、播客式音频摘要。
https://notebooklm-ai.com/

3、WPS AI
深度嵌入WPS Office的全场景AI办公助手,主打Office原生集成、中文职场/政务深度适配、数据与文档一体化处理,是国内最贴合日常办公的AI工具。Office全链路 AI 增强,覆盖 Word/Excel/PPT/PDF,无需切换工具。融合腾讯混元 + DeepSeek,中文理解与格式控制极强。
https://ai.wps.cn/

4、NotionAI
知识管理 + 工作流自动化,将文档、任务、数据库与 AI 深度融合,实现 “一站式研发与项目管理”。文档 + 数据库 + AI一体化,适合个人 / 团队做知识管理、项目管理、长期笔记。
https://www.notion.com/zh-cn/product/ai

5、语雀AI 语雀是蚂蚁集团旗下语雀知识库的原生AI助手,主打「知识创作 + 全库问答 + 团队沉淀」,是国内最适合技术团队做文档与知识库管理的AI工具;知识库原生AI,深度嵌入语雀编辑器,专注文档写作、长文处理、全库检索与知识沉淀。
https://www.yuque.com/


排名不分先后,欢迎留言补充一起学习交流!