“ AI大模型为企业带来三大价值:一是提升效率。通过语音交互、图像处理等技术,辅助企业内部运营。二是创造增长。基于用户需求,开发新产品新业务。如广告、电商等。三是赋能决策。分析大量数据,给出洞察和建议,帮助企业决策。AI是新基建和新动能,明确目标用户和业务场景,释放AI的潜力,助力企业转型升级。”
01
—
兴起
最近,一位朋友向我提出了一个问题:AI人工智能(即ChatGPT)究竟能为企业做些什么呢?
这个问题一下子让我陷入了沉思。毕竟,自从ChatGPT,这个大模型LLM的领军模型惊艳亮相以来,我感觉它几乎可以应付一切。仔细回想,发现很多大厂、企业、个人已经开发出各种基于大模型的应用,但仍有许多企业和个人对于AI大模型如何能够助益他们,还感到困惑不解。
以史为鉴,第一次工业革命的推动力是蒸汽机,当蒸汽机逐渐演进为内燃机并开始广泛应用时,第二次工业革命的创新者——电能及其相关设备正处于初创阶段。而在电力设备逐渐演进为微电子技术时,各种燃油引擎仍在不断改进和推广中。
从这个规律来看,尽管大型语言模型(LLM)现在占据了AI领域的中心舞台,吸引了所有人的关注,但这并不意味着在LLM出现之前AI毫无发展。
在大模型出现之前,AI人工智能已经应用在各行各业中。有以决策为特长的老一代机器学习应用,也有以及侧重感知能力的“传统”深度学习应用。
例如,谷歌、百度、网易等大厂的“翻译”网站,已经广泛应用到高铁进出站的“人脸识别”都是深度学习的典型应用。
任何一个技术革新,都会经历一个“三部曲”般的规律——兴起、发展和大规模应用,以及在这个过程中一次次演进式的迭代。
2018 年 Google 的研究团队开创性地提出了预训练语言模型 BERT,该模型在诸多自然语言处理任务中展现了卓越的性能。但它并没有改变每个模型只能解决特定问题的基本模式。
2020 年,OpenAI 在Google 研究团队提出的技术架构Transformer 和多头注意力机制的基础上,推出了 GPT-3 模型,其在文本生成任务上的能力令人印象深刻,并在少数样本(Few-shot)的自然语言处理任务上取得了优秀的成绩。
2022 年 11 月,ChatGPT 的问世展示了大语言模型的强大潜能,并迅速引起了广泛关注。它不仅可以进行日常对话,还能够完成许多复杂的任务:如撰写文章、回答问题等。
与以往的每个领域有一个特定模型解决任务不同,所有这些任务都由一个模型完成。在许多任务上,ChatGPT 的性能甚至超过了针对单一任务进行训练的有监督算法。
大规模语言模型(Large Language Models,LLM)是一种令人惊叹的技术,它由深度神经网络构建而成,拥有数百亿以上的参数。这些模型采用了自监督学习方法,通过大量无标注文本进行训练。
自2018年以来,诸如Google、OpenAI、Meta、百度和华为等公司以及研究机构相继发布了一系列LLM,其中包括BERT、GPT等,这些模型在几乎所有自然语言处理任务中都表现卓越。
2019年,大模型经历了爆炸式的增长,尤其是在2022年11月,ChatGPT(Chat Generative Pre-trained Transformer)的发布引发了全球广泛的热议。这一模型使用户能够通过自然语言与系统进行互动,实现了各种任务,包括问答、分类、摘要、翻译和聊天等。大型语言模型展示了对世界知识的强大掌握能力,以及对语言的深刻理解。这正是为什么大模型如此引人注目,引起了全世界范围内的兴趣和探讨。
02
—
发展
人工智能就是一个新的、不断进化的基础设施,可以让你以更好的方式解决新类别的问题或解决旧类别的问题。
它是一种通用技术,意味着它不仅对一件事有用,而是对许多不同的应用有用。它不是一件事,而是很多事情。它是新时代的“电”,可以应用在各行各业。
出现这样一种新的智能系统之后,未来大家都能很便利地、低成本地地获得智力,就像电力革命一样。
“所有产品都值得用AI重做一遍。”
“AI大模型的出现是一个划时代的里程碑,人类将进入到一个全新的智能化时代,就像工业革命一样,大模型将会被各行各业广泛应用,带来生产力的巨大提升,并深刻改变我们的生活方式。” —— 阿里张勇
在思考AI可以为企业做什么的时候,我们来看一看,大模型 ChatGPT 出现后,都出现了哪些新产品,以及哪些原有的产品有了大模型的加持。
新产品
下面两张产品榜单图来自过往发布的两份AI产品榜单:
8月国内前10:
8月出海产品前10:
《AI 产品榜 · 国内 100 强和出海 20 强(2023年08月)》
上面这份榜单上图像视频类人工智能生成的产品,在国内和出海的榜单上占据了绝大多数:占据国内前10中5个名额,出海10个中7个。
根据6月份LikeWeb流量的产品排行榜:
《国外报告90%的AI类产品公司已经实现盈利,而国内大模型和AIGC的访谈说太卷了》
第2名 character,角色扮演AI,按照你的想法,根据电影、小说、游戏、或者你现实生活中身边的人为原型创建一个虚拟的角色,然后开始跟它聊天。
第4名Poe,国外版知乎Quora推出的AI客户端,最早集成了几家LLM(ChatGPT、Bard、Claude)聊天对话在一个界面上。
第6名 PhotoRoom,增加了AI功能的移除图片背景等图片编辑类产品。
第8名 Midjourney 和 36名 Stable diffusion 都是图像生成AI。而第7名 civitai ,也是有名的C站,存放和分享SD开源模型的平台。
第9名 Hugging Face,一个NLP模型、工具和平台。一个大模型版本的云计算平台,使得开发者用大模型发布应用更简单。
第20名 theb.ai,GPT客户端。
第28名 ChatPDF ,帮助用户快速了解和总结一份PDF文档,基于ChatGPT的工具类产品。
后面国外根据LikeWeb流量榜单的产品类型则丰富得多。说明在国内,大型模型的应用仍处于初级阶段,主要产品集中在聊天机器人和图像视频生成领域。而在国外,这些应用已经迅速落地,进入了许多细分领域。
大模型加持
最早将大模型应用到自家产品的是微软(ChatGPT 背后的投资者),将ChatGPT 应用在 Bing 搜索引擎之中。
随后谷歌将大模型引入了自家的互联网广告,广告收入占谷歌总收入的77%,作为先进生产力代表的AI大模型,其率先在广告业务开花结果。
谷歌将大模型渗透到了广告业务的方方面面:
同样将大模型的能力直接集成到自家产品的,还有微软的 Office 家族,国内金山公司的WPS Office 家族(覆盖了文档分析、大纲写作、PPT制作、翻译等各类办公需求),阿里的钉钉,百度的百度文档,字节跳动的剪映(字节也推出了自己的聊天机器人:豆包)等等。
百度文档的AI助理功能
这些产品有了大模型的助力后,增强了原有功能,提供给用户更多的选择,丰富了用户使用体验,增强了用户的粘性。
除了这类在自家产品增加智能助手的企业做法,很多国内头部的内容网站也都上线了AI助手的功能。
内容平台拥抱的是AI的创作能力,目的是激发站内内容生产活力,填充内容池。
中长视频为主的B站推出了“AI视频小助理”“AI课代表呀”等AI账号试水,用户只要在评论区@AI视频小助理、有趣的程序员这类AI工具账号,并下达“总结”、“高能空降”等指令,AI账号就可以根据时间轴,逐条梳理出视频核心要点。
虎扑则推出了AI伴侣,目的还原球星的个性与风格,与用户互动,更可以自由设置AI机器人的长相、性格、声音。
快手在9月15日开启内测的AI文生图功能“AI玩评”,用户输入指令就可以在评论区快速生成梗图。另一款创作工具“快影”,则是基于AI算法将用户照片一键转化为油画风、水彩风、动漫风等多种风格化效果图片。
抖音推出的“AI绘画”滤镜特效,以裂变传播的短视频拓宽了用户对AI绘画的认知。
AI的兴起,使得内容平台可以探索一个个全新的留存用户工具。
电商平台则采用了AI对话的形式来帮助用户更快的找到合适的商品。
淘宝问问链入了阿里云“通义千问”大模型,推出了“资深导购员”“生活小能手”“美食达人”“旅行策划人”“灵魂写手”五个功能,这五个功能对应的就是用户消费生活的多个场景。在淘宝站内,这些功能也直接和消费链路直接绑定在一起。
百度电商的AI导流入口也隐藏在百度的搜索框中,用户只要在百度搜索商品,AI算法便将站内创作者的相关测评、种草内容以及商品链接全部汇总至百度页面上。
一站式旅行平台携程也将AI技术与旅行这一场景进行融合,基于携程在出行场景的数据沉淀,打造了深耕旅行场景的AI应用——携程问道。
人工智能大佬吴恩达分享过几个AI应用的场景:
作为国内顶级大厂,华为的发力方向是做垂直类的大模型。
华为盘古大模型,根据公开的信息报道,已在金融、金融、制造、医药研发、煤矿、铁路等诸多行业发挥着巨大价值:
还有更多的行业和企业,也在探索跟大模型结合的业务场景。
03
—
思考
曾经和农业方面的朋友交流过,如何利用大模型在数据分析和决策方面的支持和技术上的优势,帮助农业智能化应用:
开发人员通常是新技术的早期采用者。对 2023 年 5 月、6 月的 ChatGPT 提示进行分析发现,30% 的 ChatGPT 提示与编程相关。其次,最大的大模型接受过包含大量代码的数据集(例如互联网)的训练,这使得大模型特别擅长响应与编程相关的查询。
从技术角度来说,目前还只是大模型时代的初级阶段。现在是用大数据训练模型把推理能力训练出来了,后续我们需要更多可落地的产品,应用在各个方面的生活工作场景。
今天的大模型还有巨大提升空间,并且还在不断提升,例如多模态;同时另一方面大模型的本身的表现却还不能保持足够稳定,例如幻觉,这个时候理解技术的边界,合理的设定目标和要解决的问题,是很有必要的。
如何在大模型还在发展阶段,规划AI产品的开发原则?
以开源模型当 L0 底座,在这之上,做 L1 语言模型、L2 行业模型、L3 场景模型。跟客户通过 AI Agents(代理)来互动得到反馈,模型一点点迭代。将来更好的开源模型出现,在它的基础上再重新训练或继续迭代。
在知道大模型的能力范围,目前的模型和各类AI应用发展情况后,如何考虑AI帮助企业做什么?应该问三个问题,并考虑清楚问题的答案。
用户是谁?他们的问题是什么?能做些什么来帮助他们?确定人工智能是否确实是解决用户问题的有用基础设施。
定义清楚要解决谁的什么问题,定义越清晰,能力越到位,做的东西就能真正「收敛」,真正有商业「穿透力」。
企业的本质在于数据以及流程。
大企业降本增效,小企业引流工具。
小企业并不关心技术和愿景,谁能帮它们解决增长问题,就会因此付钱。
大企业的数据化,智能化,最主要的目的就是要降本增效。但效率优化空间总有尽头,可是增长和发展的空间,却相对无限。企业服务里开源远比节流重要,用户永远愿意为了发展而付费。
企业内部要引入人工智能,获得AI的助力,也可以遵循上面同样的思考原则,要么降本增效,要么获得增长。
人工智能与专业领域的合作往往会带来新的机会,新的方向。知识数据库与基础模型一样至关重要。个人和企业记录并组织他们的数据,包括过程和结果数据,将在人工智能驱动的世界中获得更大的竞争优势。可以利用这些记录的私有数据供算法使用,创造独特的内容,并做出更加高效的决策。
例如,出现了很多搭建企业专有知识库的开源项目,还有和知识图谱结合的探索等等。
《教程|使用免费GPU 资源搭建专属知识库 ChatGLM2-6B + LangChain》
04
—
尾声
在人工智能领域的初创公司,如果目标明确,那么AI项目的实施通常会相对顺利。然而,对于那些原本不涉足AI领域的公司,要想推进AI项目,可能会面临多种实际问题:
在面对这些挑战时,关键是建立一支具备AI知识的团队,积极寻找并明确业务需求,做出必用场景,爆款场景,以及有意推动大家去使用,与管理层进行有效的沟通,以确保AI项目的顺利推进。
这部分则涉及到跨领域问题,比如项目管理和推进策略,这需要专门的讨论,不在此占用篇幅。
阅读推荐:
逆转诅咒|大模型的最大BUG!A=B 训练的大模型LLM无法学会 B=A?国内模型说可以
OpenAI新突破:DALL·E 3与ChatGPT协同创作,只需简单提示可生成连环画
大模型应用发展的方向|代理 Agent 的兴起及其未来(上)