Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >今年,中国AI大模型产业发展看这些

今年,中国AI大模型产业发展看这些

作者头像
机器之心
发布于 2024-04-12 04:39:19
发布于 2024-04-12 04:39:19
1100
举报
文章被收录于专栏:机器之心机器之心

机器之心报道

作者:泽南

现在的人工智能,已不是「可以用」,而是「非常好用」了。

上个星期,谷歌与李世石一次久违的对话,唤起了人们的回忆:

仔细想来,自 2016 年 AlphaGo 在围棋上打败人类起已过去八年。如今人工智能技术的发展却丝毫没有减速,正在给我们创造更大的震撼。

生成式 AI 技术从引领技术爆发的 GPT-4 开始,已经席卷了各个领域。不论是自动写文章,还是生成图片和视频,大模型等技术正随着 Copilot、AI 手机等产品逐步落地。在可见的未来,向我们招手的还有具身智能 —— 通过软硬件结合,机器人正在变得更聪明,即将代替我们的部分劳动。

最近,「新质生产力」理论正成为科技领域的热门话题。新质生产力是以新产业为主导的生产力,它相对传统生产力呈现出颠覆性创新驱动,具有产业链条新、发展质量高等特征,对新旧动能转换发挥着引领性作用。

而 AI 大模型技术的突破,正是驱动科技创新,构建未来产业的强大动力。人工智能带来的科技革命可能会像工业革命、信息革命一样,给每个人的生活带来巨大的改变。

3 月 26 日,博鳌亚洲论坛上,人民网正式发布了《2024 年中国 AI 大模型产业发展报告》,阐述了中国 AI 大模型的发展现状和典型案例,深入探讨国内 AI 大模型产业发展所面临的挑战,同时也对未来趋势进行了展望。

报告下载链接:http://download.people.com.cn/jiankang/nineteen17114578641.pdf

其中有关「下半场」竞争态势、端侧应用爆发等判断,尤为值得关注。

AI 大模型技术落地,将是大浪淘沙

人工智能在持续发展的过程中,已在很多地方实现了落地,包括但不限于语音识别人脸识别机器翻译、目标检测、图像生成、辅助驾驶等等方面。很大程度上,新技术已经在帮助千行百业提高生产力了。

随着生成式 AI 技术的发展,智能化升级的范围还将扩大,程度还会更高。作为拥有 AI 完整产业体系的国家,新一代 AI 方案正在中国深入各行各业。

不过,要实现真正的技术变革,我们还面临着一系列挑战。

第一个挑战是算力短缺。随着大模型规模呈现指数级增长,算法越来越依赖高性能 AI 芯片。有市场研究公司报告称,去年仅 Meta 和微软两家公司就从英伟达处分别购买了 15 万块 H100 GPU,各花去约 45 亿美元,但这还远远不够:基于 H100 的服务器的交付周期已经长达 52 周。

在国内,高性能 AI 芯片市场还因为进出口限制和技术瓶颈的双重影响,大模型产业发展正在受到算力层面的制约。

第二个挑战是大模型架构的局限性。如今的 AI 预训练大模型均采用自注意力机制的 Transformer 神经网络结构,它在自然语言处理等领域具有诸多优势,包括可实现完全并行计算、捕捉长距离依赖关系、模块化设计、处理不定长序列、结构扩展以及预训练效果好等等。

但随着人们的不断开发与扩展,transformer 固有的算力消耗资源大、内存占用多、泛化能力有局限性等问题也逐渐显现。

就连 Transformer 论文《Attention Is All You Need》的七位原作者在最近 GTC 大会的圆桌讨论上也表示,这个世界需要比 Transformer 更好的东西,才能将我们带到新的性能高原。

对数据的运用,是制约大模型落地的另一个重要因素。对于从头开始训练的大模型,语料数据的质量很大程度上会影响模型能力。大模型对数据供给的要求极高,比如 OpenAI 在训练 GPT-4 时,就在大约 13T token 的数据上进行了训练,其中包括基于文本和基于代码的数据,以及来自 ScaleAI 和内部的一些微调数据。

相对而言,国内的 AI 大模型数据面临着数据类型不全面、信息可信度不高等问题。整体来看,可用于大模型训练的中文数据库相比英文数据,体量严重不足。

最后,我们还在期待更多爆款应用。ChatGPT 自发布以来迅速成为史上增速最快消费级应用,提供支持的微软也将大模型技术引入到了 Office、Teams 甚至 Windows 操作系统中。而在国内科技公司的生态中,至今仍没有出现类似的爆款级应用,原因可能在于尚未找到商业化思路,技术、个性化程度仍未满足用户需求。

可以说,在生成式 AI「百模大战」后,算法创新优化、生态构建和应用落地等任务,为正在构建 AI 技术体系的公司提出了更高的要求。只有少数脱颖而出者,才会进入未来的大规模应用阶段。

新方向已出现:走向端侧,端云结合

毫无疑问,在 AI 新技术上,国内科技公司一直在坚持投入,已经收获了不小的成果。

通过大规模数据训练,数百亿甚至千亿参数量级的通用大模型能够学习捕捉复杂规律和特征,对前所未见的数据做出预测。通用大模型能理解学习多种任务,得益于大规模预训练和微调范式,可完成多领域任务,并具备多模态的理解和生成能力。

以百度文心一言、阿里通义千问、科大讯飞星火、腾讯混元大模型等为代表,一批高参数体量的云端大语言模型充分利用了算力和海量训练数据,已经能提供语言理解、知识问答、数学推理、代码生成等能力。

它们一边面向 C 端个人用户提供智能问答、文本摘要与生成、图片生成、视频生成等功能。另一方面面向 B 端企业用户,正在改变企业的传统业务模式,正在提供智能化营销、客服、自动会议记录、文本翻译、预算管理等前所未有的能力。

基于通用大模型基础,我们看到了面向特定行业和领域的专用大模型,已开始进入金融、政务、医疗等领域。

而在端侧方向上,接连出现了 AI 手机和 AI PC 两个新概念,大模型展现了广泛的应用前景。

基于端侧深度优化的「小体量」预训练模型能力,个人设备的使用方式和习惯正在被重塑。AI 已经能提供文档搜索、智能识屏、图像创作、生活助手、出行助手等个性化服务。随着大模型的极致优化,人们甚至在展望智能穿戴设备上的大模型应用。

端侧大模型一方面可以为人们带来更加个性化的 AI 能力,对用户意图进行更深度、精准、细腻的理解,提供更加个性化的复杂场景服务。同时也能够保证数据位于端侧,保护了人们的隐私信息。

另一方面,一部分云端计算任务转移给终端处理,还会大幅降低算力成本;一些复杂的工作和在端侧处理后的内容,也可以通过网络交由云端千亿级,甚至万亿级的 AI 大模型来进行处理,这就是「端云协同的 AI」。

端云协同进化的大模型体系有望解决当前大模型范式面临的一些问题与挑战:

  • 在计算资源方面,端云协同能够充分利用云端、终端的碎片化计算资源,并与通信以及存储资源进行联合优化;
  • 在模型架构方面,端云大小体量不同的模型以及聚合的新模式,同时获得了大模型的涌现能力与小模型的功耗优势;
  • 在数据方面,快速发展的大、小模型和各类应用正在催生规范化、行业细分的数据治理体系;
  • 在应用方面,端侧大模型在理解用户意图后,可以高效调用其他大模型、服务和硬件能力,实现极高的可用性。

这或许会是新一轮人工智能的变革方向所在。

AI 手机落地引领趋势

正是因为端侧 AI 大模型和「端云协同」的前景,率先把大模型落地到消费级领域的,是各大手机厂商。

去年末到今年初,国内众多厂商陆续推出了新一代旗舰手机,生成式 AI 能力不约而同地成为了发布的重点。

这些手机厂商提出的「AI 手机」有的发力意图理解,通过端侧 AI 技术,以人为中心,利用个性化信息、传感器能力大幅提升手机的情境感知水平,带来各种高效的智慧服务。

有的通过平台化 AI,以端侧 + 云侧模型连接各类服务,实现了高效的推理决策。而利用大模型「智能体」将复杂任务分解,并在每个子步骤实现自主决策,手机不仅对人发出的指令和需求实现了深度理解,还可以进一步简化操作,自主实现多种复杂目标。

在这其中,vivo 在大模型端侧化、矩阵化的表现尤为突出,在新发布的报告中作为企业案例获得了详细介绍。

去年 11 月,vivo 正式发布了自研 AI 大模型「蓝心 BlueLM」,并搭载于新一代旗舰手机 vivo X100 系列上率先落地。

这是行业内首个在手机端运行的开源自研大模型,其覆盖十亿、百亿、千亿三个参数量级,共计五款模型。基于蓝心大模型能力,vivo 在端侧提供了蓝心小 V 和蓝心千询两款应用,并为手机提供了全局智能辅助功能。

vivo 的技术创新,已经让很多人享受到大模型带来的便利。官方给到我们一组数字:蓝心大模型目前已经覆盖了超过 2000 万用户,实现了 2761 万次高质量问答、生成了 1757 万张画,写了 649 万份报告,「AI 修图」功能还消除了 85 万个路人。

在这背后既有端侧大模型能力和优化带来的优势,还有 vivo 大模型矩阵化的功劳:不同参数量级的大模型可以通过多种部署方式应用于不同场景,在满足用户手机端侧体验的同时,优化了推理性能以及端侧部署时占用的内存和功耗。

其中,蓝心大模型的 1B 和 7B 版本可在手机端运行,既实现了面向端侧硬件能力的优化,又提供了良好的 AI 生成能力,使得一些应用可以全天候正常运行。

70B 版本的蓝心大模型则是面向云端服务的主力模型,提供角色扮演、知识问答等能力,既有智能涌现,也能兼顾成本和性能。面向复杂任务,vivo 也通过 1300 亿和 1750 亿两款大模型,依靠更丰富的知识量,带来了更加专业的智能体验。

随着参数量的提升,蓝心大模型逐渐具备了文本总结、语言理解、文本创作、知识问答、角色扮演、复杂逻辑推理、复杂任务编排等能力。结合新一代手机的 AI 算力,蓝心大模型实现了端侧部署与端云结合的能力。

博鳌亚洲论坛期间,vivo 介绍了蓝心大模型的最新落地进展:目前手机用户们获得的 AI 能力已升级到「端侧 7B」+「云侧 70B」的组合,充分利用到了端云结合的优势。

vivo 在人工智能技术的四大维度 —— 数据、人力、算法、算力上都做到了领先:自 2017 年起,vivo 组建了人工智能研究团队,并建设知识图谱积累数据,多年来已在顶级期刊发表了一系列高水平论文。vivo 的研究成果正在不断转化为工程应用,目前其自研大模型已位居大语言模型综合性考试评测集 C-Eval 中文榜单前列。

C-Eval 排行榜:https://cevalbenchmark.com/static/leaderboard_zh.html

通过对手机生态和用户使用特征的深度思考,端侧智能助理通过大模型的加持获得了前所未有的能力,已不仅仅是「能够与人自然对话」,而是在大量用户学习、生活、工作等场景上都带来了颠覆性的体验。

2024 年,AI 大模型应用落地爆发?

AI 手机还有很大的发展空间。随着 AI 算法迭代优化、芯片性能提升和应用场景拓展,新生产力将日益普及,满足人们不断增长的多元化需求。

AI 大模型将深刻影响人们与设备交互的方式,今年或许就将发生质变。

在博鳌论坛上人们表示,2024 年随着从政府到开发者各个层面的支持、用户需求的激增,再加上科技公司投入力度的推动,大模型将进入快速发展的阶段。如果具体到手机上,结合 AI 大模型端侧化、矩阵化的技术演进,大模型技术的落地将颠覆一系列我们眼中一成不变的功能。

我们可以期待未来手中的设备,能够呈现出完全不同的形态。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-03-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
大模型的现在进行时:走出对话框,走向产业端
大模型热潮涌动了一年多后,越来越多人平复了激动的情绪,开始从客观的视角重新思考大模型的价值和机会。
Alter聊科技
2024/04/25
1730
大模型的现在进行时:走出对话框,走向产业端
端侧大模型浪潮奔涌而至:态势、影响与建议
10月10日,Vivo推出蓝心端侧大模型 3B,其AI能力已覆盖60多个国家和地区,服务超5亿手机用户,大模型token输出量超过3万亿;随后,字节发布首款AI智能体耳机Ola Friend,与豆包深度集成;18日,荣耀同期发布了Magic OS 9.0 ,打造AI OS,其上的YOYO智慧助手已经打通了多款APP,可以实现一句话充值、一句话点外卖等服务。中国信通院与荣耀等企业还共同发布了《终端智能化分级研究报告》,推出了行业首个终端智能化分级体系。
小腾资讯君
2024/10/31
4380
以芯片、工具链和生态为引擎,MediaTek掀起智能体AI普及的第一波浪潮
基于大语言模型,智能体具备自主思考、规划,调用工具并处理复杂任务的能力,且无需依赖人类明确的驱动指令。在底层技术持续突破的当下,智能体正在重塑人机交互方式。
机器之心
2025/04/18
1130
以芯片、工具链和生态为引擎,MediaTek掀起智能体AI普及的第一波浪潮
​大模型进化论:AI产业落地将卷向何方?
“百模大战”爆发不久,大模型价格战随之而来,成本高昂的大模型几乎进入了免费时代。大模型从庞大的实验室工具,转变为高效灵活的应用助手,以狂飙猛进的速度在众多行业落地生根。
科技云报道
2025/03/04
800
​大模型进化论:AI产业落地将卷向何方?
构建端侧生成式AI生态,联发科领先高通的一步好棋
继去年11月推出天玑9300,率先将生成式人工智能(AI)带入到智能手机端之后,芯片大厂联发科(MediaTek)为了引领移动生态抓住“生成式AI手机”市场机遇,近日召开了首届“天玑开发者大会”(MDDC 2024),并携手合作伙伴共建“生成式AI手机”标准与天玑移动AI生态,加速推动 “生成式AI手机”的普及。
芯智讯
2024/05/17
1880
构建端侧生成式AI生态,联发科领先高通的一步好棋
苹果放弃造车:AI布局已被中国手机甩开一年 | 深网
意料之外的是,花费数十亿美元、秘密开展了10年的Titan项目(造车计划)会成为苹果的“弃子”。但在电车突破寥寥、生成式AI已成为全球最重要风口的背景下,苹果放弃造车专注AI项目又在情理之中。
小腾资讯君
2024/03/13
1890
加速分化:关于大模型走势的十个判断
大模型进入加速发展的第二年,技术迭代和竞争更为激烈。令全球震撼的文生视频Sora世界模拟器、拥有更强智能的谷歌Gemini 1.5、Meta的世界模型的雏形V-JEPA同一天推出,Claude3超越了GPT4的能力。Open AI的GPT5呼之欲出,奥特曼不仅自研芯片、还投资了数家可控核聚变公司,储备未来的关键资源——算力和能源。
小腾资讯君
2024/03/15
2010
加速分化:关于大模型走势的十个判断
ChatGPT的CEO共识:超级AI算力+大模型成为核心竞争力,生产力被重新定义
允中 发自 凹非寺 量子位 | 公众号 QbitAI ChatGPT正在加速将人工智能推入一个全新周期。 “AI的iPhone时刻”、“宛如互联网发明一样重要”……比尔·盖茨、黄仁勋等行业大佬已经用最为精简有力的语言,给这场技术风暴完成初步定义。 但具体呢?具体究竟会带来哪些机会和影响? 行业内外,迫切想要知道答案。 就在最近,一场齐聚了宋春雨、戴文渊、贾佳亚、周明、王在、唐文斌、范建平的panel上,发出了来自中国AI创新圈的声音: ChatGPT所代表的人工智能技术将重新定义生产力,超级AI算力+大模
量子位
2023/03/09
3.3K0
ChatGPT的CEO共识:超级AI算力+大模型成为核心竞争力,生产力被重新定义
大模型这把大火,烧到了手机领域
AI大模型从年初一直火到了年尾,但似乎离普通人还有些距离。不过,现在情况似乎有了一些变化,各大手机厂商们,正在争先恐后地把大模型装进手机里,让AI变得“触手可及”。
刘旷
2023/12/15
2200
世界人工智能大会:大模型开启"工业4.0 pro"时代
2023年可以称得上是大模型发展的元年,2月份,创新型公司OpenAI连同其发布的ChatGPT一夜爆火。之后,科技公司的大模型开始陆续亮相。
华尔街科技眼
2023/07/10
2560
天玑9300拿下生成式AI最强移动芯,端侧支持330亿大模型,1秒内AI画图,全新全大核架构做底座
它是业界首款搭载硬件生成式AI引擎,首‍次实现端侧L‍oRA融合,让大模型技能可在本地扩展,基于个人照片生成专属表情包。
量子位
2023/11/13
1.2K0
天玑9300拿下生成式AI最强移动芯,端侧支持330亿大模型,1秒内AI画图,全新全大核架构做底座
把大模型装进手机,小米、OPPO、vivo 卷起来了!
随着人工智能技术迅速发展,大模型这把“火”已经烧到了越来越多的领域,手机正是其中之一。有评论甚至认为,“大模型将重新定义手机”。可以预见未来五年,AI 对手机行业的影响,完全可以比肩当年智能手机替代功能机。那么,大模型加持的智能手机会长什么样?大模型如何颠覆手机影像、交互体验?对于程序员来讲,手机操作系统和开发相关技术栈大概会是怎样?
深度学习与Python
2024/03/26
2690
把大模型装进手机,小米、OPPO、vivo 卷起来了!
新火种AI|手机大模型开卷,但划时代的改变还没到来
1月18日,随着三星新一代旗舰S24系列的正式发布,喊出“开启移动AI新时代”的口号,在新机中引入视频AI处理、AI聊天机器人、影像画面处理、通话实时翻译等多项AI功能,AI手机正式成为国内外手机厂商共同的“进化趋势”。
新火种
2024/02/13
1200
新火种AI|手机大模型开卷,但划时代的改变还没到来
未来淘汰你的是 AI 还是懂 AI 的同事?InfoQ研究中心发布 2024 年中国技术发展十大趋势
2023 年,大模型与生成式 AI 的崛起无疑成为了技术领域的焦点。在这一年里,大模型和生成式 AI 的讨论持续“破圈”,各类商用大模型和开源大模型的发布和更新将技术创新推向了新的高峰,相关产品不断发布。
深度学习与Python
2024/02/17
2040
未来淘汰你的是 AI 还是懂 AI 的同事?InfoQ研究中心发布 2024 年中国技术发展十大趋势
洞见2025年科技潮流,技术大融合开启“智算时代”
随着2024年逐渐接近尾声,人们不禁开始展望即将到来的2025年。这一年,被众多科技界人士视为开启新纪元的关键节点。站在新的起点上,我们将亲眼目睹未来科技如何改变我们的世界。从人工智能到量子计算,从基因编辑到太空探索,每一项前沿技术都预示着一场深刻的变革。
科技云报道
2025/03/04
1000
洞见2025年科技潮流,技术大融合开启“智算时代”
发布「从容大模型」,云从扬起「数实融合」的帆
5月18日,作为国内人工智能企业第一梯队的云从科技,也发布了自身的行业大模型“从容大模型”。
AI掘金志
2023/08/26
3180
发布「从容大模型」,云从扬起「数实融合」的帆
没有App,也没有 App Store,未来的手机会干掉全部应用开发人员吗?
在上个月的 WMC2024 上,德国电信联合高通、Brain.ai 推出了一款突破性创新的概念 AI 手机 T phone。与传统智能手机不同,这款手机主打一个“无 App”,它清除了屏幕上的密密麻麻的 App 图标,只留有一个按钮用来激活手机里的 AI 助手,让用户通过类似 ChatGPT 的操作界面来交互。
深度学习与Python
2024/03/26
1100
没有App,也没有 App Store,未来的手机会干掉全部应用开发人员吗?
10年市场规模1.3万亿美元,「模力时代」已来
比如,OpenAI最新AI绘画模型DALL· E 3刚一登场,就跟ChatGPT强强联合,成为ChatGPT Plus里最令人期待的新生产力工具。
量子位
2023/10/25
1630
10年市场规模1.3万亿美元,「模力时代」已来
腾讯发布大模型时代的AI十大趋势:走进“机器外脑”时代
人工智能迅速发展,大模型技术成为赋能各行各业的关键。从算力底座、智力增强到人机协作,大模型正在重塑人类社会,成为可依赖的"外脑"。
小腾资讯君
2024/07/09
7410
AI 模型只能部署在云端?高通白皮书发布:混合 AI 是 AI 的未来
近日,高通技术公司正式发布白皮书《混合 AI 是 AI 的未来》。高通在白皮书中提到,随着生成式 AI 正以前所未有的速度发展以及计算需求的日益增长,AI 处理必须分布在云端和终端进行,才能实现 AI 的规模化扩展并发挥其最大潜能——正如传统计算从大型主机和瘦客户端演变为当前云端和边缘终端相结合的模式。与仅在云端进行处理不同,混合 AI 架构在云端和边缘终端之间分配并协调 AI 工作负载。 云端和边缘终端如智能手机、 汽车、个人电脑和物联网终端协同工作,能够实现更强大、更高效且高度优化的 AI。
深度学习与Python
2023/08/09
4640
AI 模型只能部署在云端?高通白皮书发布:混合 AI 是 AI 的未来
推荐阅读
大模型的现在进行时:走出对话框,走向产业端
1730
端侧大模型浪潮奔涌而至:态势、影响与建议
4380
以芯片、工具链和生态为引擎,MediaTek掀起智能体AI普及的第一波浪潮
1130
​大模型进化论:AI产业落地将卷向何方?
800
构建端侧生成式AI生态,联发科领先高通的一步好棋
1880
苹果放弃造车:AI布局已被中国手机甩开一年 | 深网
1890
加速分化:关于大模型走势的十个判断
2010
ChatGPT的CEO共识:超级AI算力+大模型成为核心竞争力,生产力被重新定义
3.3K0
大模型这把大火,烧到了手机领域
2200
世界人工智能大会:大模型开启"工业4.0 pro"时代
2560
天玑9300拿下生成式AI最强移动芯,端侧支持330亿大模型,1秒内AI画图,全新全大核架构做底座
1.2K0
把大模型装进手机,小米、OPPO、vivo 卷起来了!
2690
新火种AI|手机大模型开卷,但划时代的改变还没到来
1200
未来淘汰你的是 AI 还是懂 AI 的同事?InfoQ研究中心发布 2024 年中国技术发展十大趋势
2040
洞见2025年科技潮流,技术大融合开启“智算时代”
1000
发布「从容大模型」,云从扬起「数实融合」的帆
3180
没有App,也没有 App Store,未来的手机会干掉全部应用开发人员吗?
1100
10年市场规模1.3万亿美元,「模力时代」已来
1630
腾讯发布大模型时代的AI十大趋势:走进“机器外脑”时代
7410
AI 模型只能部署在云端?高通白皮书发布:混合 AI 是 AI 的未来
4640
相关推荐
大模型的现在进行时:走出对话框,走向产业端
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档