《大模型时代:ChatGPT开启通用人工智能浪潮》一书通过深入分析大模型的技术原理、社会影响和产业应用,展示了大模型作为人工智能发展的新阶段,将如何引发社会和经济的重大变革。作者不仅提供了丰富的技术细节和案例研究,还通过历史类比和产业分析,为读者呈现了一个全面而深入的大模型时代图景。
作者简介:
龙志勇:曾任阿里巴巴资深产品专家兼事业部副总经理、硅谷AI创业公司联合创始人兼首席运营官,获GMIC“AI Startup Top10”等荣誉,在人工智能、云计算、互联网行业深耕20余年。曾撰文《从<华为的冬天>到AI的冬天》,并有多本畅销译著:《如何创造可信的AI》《稀缺》《超级合作者》《需求》等。
黄雯:互联网大厂高级AI产品经理,曾就职于腾讯和AI创业公司,积累了丰富的AI产业互联网、自然语言处理和大模型应用经验。
大模型是人工智能从 “弱 AI” 向 “强 AI” 演进的关键转折点,其涌现能力(如逻辑推理、多模态交互)标志着人类进入 “大模型时代”。大模型是继印刷术、互联网之后的第三次智力革命,将重构人类知识生产和协作方式。
技术篇:大模型的原理与演进
解析 ChatGPT 的工作机制(如 Token 预测、Transformer 架构)、训练过程(预训练、监督微调、强化学习)及技术局限(幻觉)。
讨论大模型的 “涌现能力”(如复杂推理)、与人类智能的对比(如思维链、上下文学习),以及未来发展方向(多模态、插件扩展)。
作者观点:大模型的核心是 “预测下一个 Token” 的自回归机制,通过海量数据训练和参数规模扩张实现能力跃升。
技术局限(如幻觉、数据偏见)需通过持续优化(如 RLHF、插件整合)解决。
变革篇:大模型与社会经济的重塑
对比工业革命历史,分析技术替代效应与使能效应的关系,提出 “恩格斯式停顿” 与 “技术 - 教育竞赛” 理论。
探讨大模型对知识处理(记忆、理解、创造)的重构,以及自然语言编程(提示工程)对脑机协作的影响。
讨论大模型对就业市场的冲击(如知识工作自动化),并提出应对策略(技能转型、教育改革)。
作者观点:大模型将引发类似工业革命的社会变革,短期可能导致结构性失业,但长期通过使能效应创造新岗位。
人类需提升 “问商”(提问能力)和批判性思维,与 AI 形成互补协作。
卢德主义的暴行,除了源于失业者的宣泄和抵制,还反映了技术进步初期的收益分配不均问题。原有家庭生产体系中的工人被机器取代,机器由薪酬极低的童工来照管,人力成本在收入中的占比大幅压缩,而工厂主和发明家们却拿到了大量的利润。虽然全社会的生产率在不断上升,但许多人的生活水平仍然停滞不前,甚至不断恶化。从整个社会来看,利益受损的人群比获益的群体要大得多。这段时期也被称为“恩格斯式停顿”(Engels’ pause),恩格斯曾对此进行过深入的研究,他认为“工业家在靠工人的痛苦致富”。
在变革初期,技术主要凸显出“取代”的一面,由此带来的工作岗位减少让人们感到痛苦,甚至会导致社会动荡。需要等待新的机遇,技术“使能”的另一面才会逐渐发挥它的作
用,恩格斯式停顿才会结束,人们的收入和幸福感才会跟生产率一同攀升。
新岗位能否抵消旧岗位被取代所产生的损失呢?答案取决于新技术的使能效应有多强。生产率的提高,是机器带来的直接效果。提高的生产率又能带来什么呢?
首先,在单位产品中,人力成本被大幅压缩,一部分转化为机器资本和发明专利的收益,另一部分则推动了产品销售价格的降低。站在工厂、城市或者国家的角度,产品价格低,就能在跟其他工厂、城市、国家之间的贸易竞争中抢夺更多的现存市场,分到更多的蛋糕。当产品价格降至需求弹性曲线的某个临界点时,其还能扩张产品的市场规模,把整个行业的蛋糕做大。真正的劳动替代风险并非来自高生产力的自动化技术,而是来自‘生产力一般般’的技术,这些技术虽然会被采纳并取代劳动力,但并不足以带来强大的生产力使能效应。
其次,新的技术突破,有可能带来全新的产品和服务。美国西北大学经济史学家乔尔·莫基尔(Joel Mokyr)在《富裕的杠杆:技术革新与经济进步》一书中总结道:“技术进步既创造了全新的产品,还使原有产品的品质更高,从而导致供给曲线发生移动,要么满足了既有的更高水平的需求,要么创造了从未有过的新需求。”例如,19世纪30年代开始修建的蒸汽机车和铁路;20世纪10年代开始的汽车和公路建设;21世纪10年代的智能手机和移动互联网服务,它们都是巨大的新市场、新蛋糕。更重要的是,这些新的产品又进一步促进了其他行业产品的流通。例如,火车运输让工业革命从局部走向全国乃至全球,扩大了各种产品的市场覆盖面;汽车通过扩展人们的活动范围来扩大消费需求;智能手机则通过信息流、资金流的移动化,让人们的消费需求更容易得到满足,帮助更多产品和服务获得增量市场。
我们回顾几次工业革命,技术对生产率的跨越式提升,都需要生产流程围绕新技术进行重构。
而这一次大模型是否引发了重构可以用一个简单的方法来判断——在团队和业务流程中,大模型是人的副驾,还是代驾。
微软基于ChatGPT实现的Office CoPilot,就是典型的副驾模式。在这种模式下,大模型是每一个人的私人助手,帮助人更高效地完成工作,但大模型不会独立承担工作。此时,大模型是一种高级的个人生产力工具,并没有固定的职能,使用它的场景和频率、发挥多大的价值等完全取决于如何使用它。而大模型对企业的价值,更多体现在人类员工人均工作产出的数量或质量提升,暂时还不会产生人力替代效应。
当大模型的企业级应用成熟起来,在行业中落地之后,就有可能进入全新的代驾模式。这一模式有三个特征:
1.大模型在生产流程中独立承担固定的职能,而不是听令于某一个人,做各种临时的任务。
2.大模型跟多个人发生协作关系,而不是只跟某一个人协作。
3.大模型的属性(例如模型参数、微调数据集、系统设置、提示设置),都是跟业务强关联,作为企业级的资产进行共享和管理。
简而言之,在副驾模式下,大模型从属于每个人类员工;而代驾模式下,大模型与人类员工则是平等协作关系。
应用篇:大模型的行业场景与价值
教育领域(备课辅助、个性化教学)、人力资源(招聘优化、绩效评估)、法律(合同分析、案例检索)等场景的应用。
企业业务(市场营销、客服、产品设计)、创意娱乐(数字人、旅行规划)等场景的创新。
作者观点:大模型通过提升效率(如客服自动化)和创造新需求(如 UGC 设计),推动各行业的渐进式与颠覆性创新。
应用落地需分阶段(工具辅助→流程重构→商业模式颠覆),并注重数据合规与伦理。
企业要调整业务流程和员工岗位,因为投入IT数据资源进行本地化开发和训练,需要付出较大的组织成本和人力成本。站在整体效益最大化的立场,应该评估业务各环节的大模型应用成熟度和优先级,选择最适合的应用点切入。其中一个重要的评估角度是业务环节的信
息量和容错率。
其中,信息量指的是在该业务环节中,需要阅读消化多少信息,信息量越高,大模型辅助人类的效果就越显著。容错率指的是在该业务环节中,允许错误出现的概率,容错率越高,错误造成的损失就越小,大模型的应用效果就越可控。
信息量和容错率的4种组合,对大模型应用效果有着不同的影响,企业可以根据自身情况来选择应用的短期切入点和长期目标。
产业篇:大模型产业链与投资机遇
拆解大模型产业结构(硬件、软件框架、模型服务、应用层),分析各环节的核心技术(如 GPU、分布式框架)与商业模式。
讨论开源模型(如 LLaMA)与闭源模型(如 GPT-4)的竞争格局,以及应用层的商业化路径(订阅制、插件抽成)。
作者观点:硬件层(如英伟达 GPU)和模型服务层(如 OpenAI API)是当前最直接的受益者。长期机会在于垂直领域应用(如医疗、金融)和多模态创新(如 AIGC+AR/VR)。
推理用的GPU是国内产品最佳突破点:
历史总是惊人的相似。2016年之后的一两年,“Dot-com”互联网泡沫年代发生过的各种现象又重演了。各行各业的公司都在想办法给自己贴上AI标签,期望“挂个羊头”就能拿到更高的估值或补贴;发个AI合作的公关通稿就能看到明天股票的红盘;生产GPU服务器的硬件公司市值水涨船高,产量加速扩张;看到企业为AI科学家和工程师开出的薪水,不少
程序员和大学生竞相转型人工智能专业。
然而两年之后,产业和资本发现梦想中的叙事逻辑只实现了一半。技术门槛确实不低,毕竟AI科学家和工程师都更贵了,但业务的横向复制却没有那么简单。
首先,当时的AI算法模型的跨行业复制几乎是妄想。
每个行业的业务场景、目标、约束和数据都不一样,需要全新的行业AI方法论和长期跨学科合作的实践积累。
其次,AI算法模型的同行业跨客户复制成本也很高。
在AlphaGo这种决策型的AI应用场景中,每一个行业客户不仅需要按照AI的要求,花很大精力和成本,准备自家的训练数据,而且还要面对生产环境下非常不确定的AI模型效果。这就导致,甲客户的AI模型运行效果好,并不意味着同行业的乙客户也能做好,甚至甲客户项目这个月的成功,也不意味着他下个月还会成功。而且,AI模型在行业应用中担任大型系统中的一个环节,它的不确定会造成整个系统的不确定。
泛化能力:在从未碰到过的新情况下,AI能够正确理解并执行适当动作的能力。在同样的数据集训练基础上,泛化能力越强,就越能适应新的条件和场景,从而解决更多种类的问题。
基于这样的规模效应,大模型确实涌现出了许多泛化能力,体现了一定程度的通用性,但离真正的AGI(按伊利亚的标准,其泛化能力应达到人类大学本科生的水平)还有距离。
■纯文本信息还不足以建立完整的世界模型。目前的大模型在文本学习上有突破,图片学习效果还有待验证,而视频学习则可能要引入Transformer模型之外的新技术。
■大模型的泛化能力是有边界的。当前大模型从文本中学到的能力主要集中在自然语言相关的认知智能领域,而在以图像识别为代表的感知智能和以用户行为预测为代表的决策智能领域,大模型则未必适合。即便在认知智能领域,其也存在规划能力不足等一系列缺陷。
■在自然语言相关的认知智能边界内,泛化的产生是被动的。从涌现机制的角度看,只能通过事后观察来分析浅层的规律,无法做到新技能涌现的可知、可预测、可控,也就很难提升新技能涌现的效率。
从产业的角度,对大模型在各行业场景下的泛化和复制能力,建议“小马过河”,谨慎乐观。单纯地期待涌现不可靠,产业界需要找到配套的方法,让大模型落地的结果更可控。
1.选好做什么,不做什么。
在一些场景中,大模型现有的一些缺陷对商用的影响没那么大,甚至可能是助益,如强调个性化和趣味性的聊天应用的character.ai的创始人说:“我并不认为幻觉是需要解决的问题,我甚至很喜欢它,这是模型有趣的特点。”在character.ai做的“角色扮演”聊天场景中,幻觉是想象力的源泉。但对另一些容错很低的行业,如医疗诊断、自动驾驶、工业自动化,
幻觉却危害显著。
在适合使用GPT大模型能力的领域,针对幻觉、规划能力不足、缺乏长期记忆等缺陷,现在都有部分解决方案。
机器手段包括通过本地数据库查询的方式,在对话中带入历史记忆,增加模型的记忆能力,通过两个模型间左右互搏的方式识别幻觉。人工手段包括通过提示工程指引大模型进行复杂规划,采用人工审核的方式来发现并纠正模型幻觉。
以上手段在不同行业场景、不同数据环境下的效果与成本,需要用实践验证,其综合结果会影响GPT大模型在这个行业或场景的商业价值。
3.针对目标行业进行深入定制化,对快速颠覆怀有谨慎期待,对额外的成本有预期。
由于大模型仍无法通吃所有行业,越来越多人意识到,在通用大模型之上,还可以针对垂直领域精细化训练和定制大模型,这类模型仅在指定行业场景下执行有限种类任务,规模可适当缩小。
从轻到重,做定制化的方式有:
■基于已有闭源大模型的API接口,通过应用级的微调和打补丁做定制应用。
■选择开源的、已经完成预训练工作的基础模型,做更多定制。
■从头自己训练垂直模型:从预训练数据选择、模型结构设计切入,
定制全新大模型,以解决特定行业场景的问题。如彭博推出了500亿参数的金融垂直大模型BloombergGPT,预训练使用的金融数据集和通用数据集各占一半,在金融特有任务,如在新闻情感分析领域领先于通用大模型。
越重的做法,成本越大,壁垒也越高。不同行业,怎么做最有竞争优势,没有标准答案,但可以有一个大致的决策模型:
更稳的选择是先做最轻的打补丁,在掌握问题和数据、验证业务价值后,再决定是否走彻底定制路线。然而,这种做法可能错过时间窗口,导致追不上行业里更早做出垂直模型的公司,后者可能更快形成数据反馈到模型能力迭代的“数据飞轮”,与其他人拉开差距。
什么是AI公司?什么是大模型公司?大模型产业中最好的商业会在哪里?
利用AI技术能力创造差异化价值的公司即可视为AI公司,大模型公司同理。
1.卖算力,是大模型产业短期内最赚钱的商业。
2.MaaS卖大模型,并且通过客户积累形成数据飞轮壁垒,做有飞轮效应的水电煤,是最有想象空间的商业。
3.将大模型能力与行业结合,提高现有业务的生产力,是最现实的商业。
4.将大模型能力与行业结合,在某个应用场景中形成颠覆性创新,面向最终消费者创造新的价值,引领行业甚至创造一个新的行业及相关就业机会,这是最好的商业。
5.利用大模型赋能给原本智力资源缺乏的地区,提高社会基础服务(教育、医疗)的质量,实现更高层次的教育公平、医疗公平,长期可缩小地区间发展差距,形成新的消费市场,这是最好的社会事业。
本书对于股票投资者的启发:
硬件层:GPU 厂商(如英伟达、AMD)和算力基础设施(云服务商)是短期受益者,需关注技术迭代(如 H100 性能)和供应链稳定性。
模型服务层:闭源模型(如 GPT-4)的高壁垒与开源模型(如 LLaMA)的生态潜力并存,关注具备数据飞轮效应的平台(如 OpenAI、Hugging Face)。警惕技术迭代风险:开源模型(如LLaMA)可能降低闭源模型的商业价值,关注Meta、华为、DeepSeek等开源生态主导者。
垂直应用层:
知识密集型行业:法律(如 CoCounsel)、医疗(AI 辅助诊断)、教育(个性化学习平台)可能率先商业化。关注传统行业与 AI 融合的机会(如制造业智能化)。
优先选择“数据护城河”企业(如拥有医疗影像库、金融交易数据的公司)。
多模态能力(图像→视频生成)或催生新龙头(如Adobe、Unity)
大模型是“基础设施级”技术,类似互联网的TCP/IP协议,早期投资应聚焦底层技术(算力、框架),中后期转向应用层创新。
关注“AI+机器人”结合场景(如特斯拉Optimus),硬件载体或成下一爆发点。
创意与娱乐:AIGC 工具(如 Midjourney、Character.ai)和虚拟社交平台具有高增长潜力。
风险提示:
技术泡沫:警惕过度炒作概念(如 “AI+” 题材),关注实际落地能力与盈利模式。
竞争格局:巨头(如谷歌、微软)与初创公司的博弈可能重塑产业格局,需跟踪技术路线(如多模态、插件生态)。
伦理与监管:数据隐私、算法偏见等问题可能影响企业估值,需关注政策动向。
本文分享自 Dance with GenAI 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有