Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >跨语言、跨模态、跨任务的大模型,驱动应用生态繁荣

跨语言、跨模态、跨任务的大模型,驱动应用生态繁荣

作者头像
用户1386409
发布于 2023-03-06 06:19:57
发布于 2023-03-06 06:19:57
8190
举报
文章被收录于专栏:PaddlePaddlePaddlePaddle
本系列根据WAVE SUMMIT + 2022深度学习开发者峰会「AI大模型 智领未来」论坛嘉宾分享整理。文章整理自百度技术委员会主席吴华的主题分享——「大模型技术驱动应用生态繁荣」。

目前,大模型技术的不断发展,促进了智能系统快速发展,进一步提升了应用效果和效率。而在交互过程中所产生的新数据,又不断驱动大模型技术升级,从而形成了技术、应用、数据的闭环正循环,极大提升生产力,促进生态繁荣,使人们生活更加美好。

大模型迭代闭环趋势

众所周知,大模型技术不断发展,已经从大模态发展到了多模态和跨模态,比如从Instruct GPT3技术发展到跨模态的DALL·E-2技术,同时大模型在应用过程中也产生了非常好的轻量级应用技术,比如Prompt Turning技术。这些技术发展促进了应用繁荣,比如最近半年出现的以AIGC应用为代表性业务的独角兽创企,达到了十亿美元以上估值。同时,大模型技术也促进了端到端智能系统的快速发展,进一步提升了应用效果和效率,而这些应用在与用户、环境的交互过程中产生了海量新数据,这些数据又不断驱动大模型技术升级,从而形成了技术、应用、数据的正循环。

大模型技术日趋成熟

在这个正循环里,大模型是根基。同时大模型不断发展,资深技术也日趋成熟。

自然语言处理领域,大模型具有更强的小样本学习能力,比如基于思维链的Flan-PaLM,该模型已经具有基本推理能力;再如基于层次化多任务学习的文心ERNIE 3.0 Zeus。同时为了进一步降低落地门槛,出现了效率高、泛化能力强的轻量级大模型,比如文心ERNIE 3.0 Tiny。

计算机视觉领域,百度提出了基于视觉掩码技术的文心VIMER-CAE,在图像分割任务中,该模型泛化能力较强。Google训练了一个模型参数规模高达170亿的多任务视觉学习模型PaLI,该模型在多任务学习上效果得到了显著提升。

跨模态领域,最近提出了扩散模型,该模型引发了文本到图像生成技术的变革,比如百度提出了文心ERNIE-ViLG 2.0,该模型可以生成语义更相关、质量更高的图片。同时这个技术浪潮也催生了文本到视频领域的技术革新,比如当输入“正在画肖像的泰迪熊”这句话时,大模型能够直接生成一个正在画肖像的泰迪熊的视频,诸如此类的技术不断繁荣。

大模型的使用门槛进一步降低

大模型的效果有目共睹,但在应用过程中,研发者需要进一步降低其使用门槛,主要面临两个问题。

第一个问题是面对大模型学习的海量知识和技能,如何在应用中有效激发,达到最好效果。针对这个问题,百度提出了Prompt技术,该技术能在下游任务中,通过使用Prompt去应用相关知识,从而提升模型效果。当前大模型已经能自己写Prompt,且超越了人类水平。因此,大模型在下游任务中的门槛进一步降低。

第二个问题是在一些应用场景中,对速度、时延、存储都有严格要求,如何使模型更轻量化也是大模型应用所面临的挑战。针对这个问题,百度推演出大小模型协同促进的研发范式,一方面大模型将效果推到极致,让小模型向大模型学习;另一方面小模型利用已有知识辅助大模型进行知识选择,提升迭代效果,降低使用成本,由此产生飞轮效应,促进大小模型协同进化。

大模型平台集约化加速应用创新

随着大模型使用门槛的降低,大模型应用呈现出集约化加速应用创新的趋势。比如百度以大模型能力为中心,构建了文心大模型套件ERNIEKit。

基于该套件,用户能够实现数据处理、模型预训练、模型微调、模型快速部署等多维度能力应用,支持40多个场景,由此衍生出来的能力可以通过开发平台和服务平台,进一步赋能开发者和生态,最终实现整个平台覆盖大模型应用落地全周期,使得开发门槛进一步降低。

大模型驱动的产业应用创新

随着大模型能力不断强大,基于大模型的智能系统驱动应用端对端创新,使传统任务系统架构大幅简化,同时提升了应用效果和效率,从而加速数据和模型应用闭环建设。如百度文心百中端对端搜索系统,能够完成端到端的文本、图像、语音不同模态之间的搜索任务,相比以前级联的搜索系统,该系统能够更好利用用户模型和数据之间、端到端地优化效果简化整个流程,不仅获得更好效果,而且节省定制成本。

此外,在进行文档理解时,以前针对文档里的无结构化文本、表格、图像,分别需要一个模型,而现在能够使用统一的模型处理文本、表格、图像等多种格式和模态,实现使用一个模型处理多个任务,而且在公开数据集上已获得SOTA效果,使文档理解系统达到商业要求。

随着大模型技术不断发展,大模型也推动了AIGC的繁荣。目前,人们应用数据或者互联网内容,主要通过普通用户或者专家产生,也即UGC和PGC内容生产模式。但现在AI也可以生产内容,其优势是既能提升内容生产效率,也能创造出独特价值和视角。

最近几年,很多国内外头部公司和创企公司都涌入AIGC赛道,同时,发展较快的AI作画、AI营销等应用都呈现出蓬勃发展趋势。围绕大模型AIGC能力,市场产生了很多应用,比如AI作画、AI营销等。AIGC除了生产文本和图像外,还能够生产视频和代码,生产代码主要是为了提升开发效率。

随着AIGC内容不断丰富,用户能够进一步探索应用效果,同时大模型也显著提升了交互体验。比如在多模态拟人效果上,基于大模型的数字人,借助形象、语音与表情更好地沟通表达、传递信息,从而大幅提升人和机器之间的交互体验。

大模型还能够进行角色扮演,用户可以自定义机器人角色,比如定义为诗人、画家、政治家等,这样用户就可以在与机器交互过程中产生不同体验。

此外,机器人可以扮演知识大百科角色,比如一位学富五车的学者,这背后主要基于文心PLATO-K大模型。作为首个中文可主动查询利用外部知识的对话大模型,文心PLATO-K能够主动学习知识,提升用户体验。

与此同时,大模型也促进了传统行业向智能化发展,加速产业落地。比如在生物计算领域,Google推出了AlphaFold2,发布了2.2亿蛋白结构预测结果,解决了生物领域50年的难题。同时,百度也推出了HelixFold-Single模型,它是在AlphaFold2基础上提升预测效果,能够进行秒级别的蛋白结构预测,而且在抗体蛋白结构预测上,比AlphaFold2更优。

此外,大模型也能够跟行业大数据结合,在金融、电力、航天、汽车、媒体等行业里,大幅提升效果和效率。

大模型持续学习应用反馈数据

人们普遍认为人在学习过程中,如果想成为某个领域专家,存在“一万小时定律”,同时在学习过程中的反馈也非常重要。这个理论对大模型同样适用,即大模型需要向大数据学习,并在学习过程中不断获得反馈信息。因此,大模型能够持续学习应用中的反馈数据,尤其在环境和用户交互过程中,通过反馈不断提升模型效果,使大模型持续学习,从而达到更好效果。比如在搜索问答场景里,通过用户反馈,模型应用效果得到进一步提升。

统一大模型进一步促进生态繁荣

随着技术、应用、数据闭环的不断发展,模型开始趋向于跨语言、跨模态、跨任务的统一大模型。

以前不同语言、不同模态和不同任务,都是单独模型;随着技术不断发展,现在能够对多个任务使用统一模型学习,比如模型能同时学习文本、语音、图像、视频等数据。而且模型在应用过程中能够与用户和环境进行交互,学习到用户行为和环境信息,比如时空数据和感知数据。而这些数据之间相互作用、相互补充,得以进一步提升模型效果,促进生态繁荣。

在大模型发展过程中,首先将现有数据学习到模型中,并应用在各行各业的任务中。同时这些应用又可以产生新的数据,并且在模型里使用,逐渐循环形成了闭环。这个闭环能够极大提升生产力,使人们的生活更加美好。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-02-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 PaddlePaddle 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
AI对比:ChatGPT与文心一言的异同与未来
ChatGPT是由OpenAI开发的大型语言模型,它使用Transformer架构,并通过大量文本数据训练得到。ChatGPT具有强大的语言生成和理解能力,能够进行自然、流畅的对话,以及生成各种形式的文本,如摘要、评论、回答等。
屿小夏
2024/01/22
1.2K0
AI对比:ChatGPT与文心一言的异同与未来
​大模型进化论:AI产业落地将卷向何方?
“百模大战”爆发不久,大模型价格战随之而来,成本高昂的大模型几乎进入了免费时代。大模型从庞大的实验室工具,转变为高效灵活的应用助手,以狂飙猛进的速度在众多行业落地生根。
科技云报道
2025/03/04
990
​大模型进化论:AI产业落地将卷向何方?
AIGC时代已来,跨模态内容生成技术发展得怎么样了
机器之心报道 机器之心编辑部 最近一年里,AIGC 是人工智能领域里最火的词汇之一。 1 月 10 到 11 日,机器之心「AI 科技年会」在线举行。本次活动中,基于对 2022 年人工智能研究、技术和应用的观察,机器之心邀请业内知名专家、高管及本年度深度合作企业,共同总结了过去一年人工智能的重要经历与成果,讨论了未来 AI 的发展方向。 在大会第二天「AIGC 技术应用论坛」上,百度文心一格总架构师肖欣延博士作了主题为《跨模态内容生成与技术与应用》的演讲。以下为演讲全文,本文进行了不改变原意的整理。 我
机器之心
2023/03/29
7210
AIGC时代已来,跨模态内容生成技术发展得怎么样了
业界首发行业大模型,提出落地3大关键路径,百度的大模型原来是这么用的
机器之心报道 编辑:张倩 这次的 Wave Summit,我们聊聊大模型,但重点不是参数。 在过去的几年,深度学习领域掀起了一场轰轰烈烈的「练大模型」运动,千亿、万亿参数模型层出不穷。但与之形成反差的是,这些大模型的落地过程却非常缓慢。前段时间从谷歌离职创业的两位 Transformer 作者也感叹,虽然他们训练的模型越来越大,但这些模型却很难用来做实际的事情。 这个问题在国内同样引发了关注。在前段时间的百度认知 AI 创意赛决赛期间,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜就提到,参数
机器之心
2022/05/23
1.4K0
业界首发行业大模型,提出落地3大关键路径,百度的大模型原来是这么用的
ChatGPT冷观察:没有大模型的土壤,开不出ChatBot的花
或者说,在中国人工智能不落后于全世界的当下,业界也在普遍渴望一个真正有实力的ChatGPT类产品出现。
用户2908108
2023/02/26
4140
ChatGPT冷观察:没有大模型的土壤,开不出ChatBot的花
如何0代码、快速定制企业级NLP模型?百度工程师详解技术选型与模型调优策略
主讲人 | 龙心尘 百度NLP资深研发工程师 量子位编辑 | 公众号 QbitAI 近几年以预训练为代表的NLP技术取得了爆发式发展,新技术新模型层出不穷。企业与开发者如何将最先进的NLP领域科研成果,高效地应用到业务场景中并解决实际问题? 「百度EasyDL AI开发公开课」中,百度资深研发工程师龙心尘结合世界领先的文心(ERNIE)语义理解技术,通过产业实践案例,深入解析技术选型和模型调优的方法,分享了工程实践中的经验。 讲解分为5个部分: NLP常见任务 NLP典型应用场景 EasyDL-NLP与文心
量子位
2023/03/10
3740
如何0代码、快速定制企业级NLP模型?百度工程师详解技术选型与模型调优策略
强调“产品化”,大模型又卷出了新高度
2022年AI绘画成了现象级应用,其背后是AI圈正火的AIGC以及预训练大模型。在预训练大模型驱动下,AI在“感知”文字、图片、声音等内容外,还具备了“认知”能力去创作内容。
罗超频道
2022/12/14
4930
强调“产品化”,大模型又卷出了新高度
当被大模型输入技术内功,数字人「文画两开花」,还在手机里随时陪你聊天
机器之心原创 作者:杜伟 能互动、擅写作、会作画,百度数字人度晓晓应了这样一句话,「天空才是她的极限」。 这年头,数字人直播带货、虚拟主播、银行客服,这些应用场景已经不再是多稀奇的事了。从时尚娱乐到文化商业,数字人迎来了全面开花。国内大厂也纷纷抓住数字人这个发展机遇,推出花样百出的娱乐和实用性数字人产品,致力于让数字人更智能化更服务化。 百度 2020 年 9 月推出的国内首个可交互虚拟偶像度晓晓,最近用她的智能互动、写作和绘画表现让人们见识到了 AI 大模型的能力。 6 月 14 日,一段由百度打造的度晓
机器之心
2022/06/24
6900
当被大模型输入技术内功,数字人「文画两开花」,还在手机里随时陪你聊天
飞桨文心大模型挑战高考作文:平均1秒生成1篇,水平超75%考生
全国高考正在进行中,百度AI技术也迎来一场“高考”。6月7日,百度数字人度晓晓在高考语文考试结束后,化身为“数字人考生”,挑战高考作文写作,引发全网热议。AI写作涉及自然语言处理、数据挖掘、知识图谱等多项人工智能技术,百度使用飞桨文心大模型支持度晓晓又好又快地完成了高考作文的写作。据报道,度晓晓参与作答了全国新高考Ⅰ卷题为《本手、妙手、俗手》议论文,40秒就根据题目创作了40多篇文章,平均1秒生成1篇,随机抽取其中一篇,其分数已赶超约75%高考考生。
用户1386409
2022/08/31
3880
大模型修复传世名画,飞桨帮助母羊产羔……这届百度世界大会,科技感与接地气并存
机器之心报道 作者:杜伟 2022 年的百度世界大会上,百度诸多亮眼发布背后的飞桨和文心大模型正在受到越来越多的关注。 在中国古代的水墨山水画中,元代画坛宗师、「元四家」之首黄公望的《富春山居图》称得上巅峰之笔,更被列为「中国十大传世名画之一」。然而,该画作由于遭火焚断为长短两卷。前半卷《剩山图》现藏于浙江省博物馆,后半卷《无用师卷》现藏于台北故宫博物院。 在今天上午举行的 2022 百度世界大会上,我们见证了 AI 让两岸画卷完成「合璧」的智能创作能力。现场,百度首席技术官王海峰博士展示了基于文心大模型补
机器之心
2022/07/26
6560
大模型修复传世名画,飞桨帮助母羊产羔……这届百度世界大会,科技感与接地气并存
大模型产业落地关键战打响!百度首发行业大模型,外加一口气十连发
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 1、2、3、4、5、6、7、8、9、10…… 谁能想到,在现如今大模型当道的节点上,别家都是一次发布一个或几个。 百度呢? 一口气,10个! 如果把它们归拢归拢,打开方式是这样的,主要涵盖三大类: 基础大模型 任务大模型 行业大模型 值得一提的是,“行业大模型”是属于业界首发的那种。 然后百度还说了,“好马得配好鞍”啊。 于是乎,为了能让开发者使用大模型时用得舒服,顺便推出了一系列开发套件、大模型API、开放平台。 还为了让开发者们基于大模型迸发更
量子位
2022/05/23
4700
大模型产业落地关键战打响!百度首发行业大模型,外加一口气十连发
全球首个知识增强千亿大模型——鹏城-百度·文心:不止于拼参数量,更有内涵和根基
或许很难想象,从晶体管的每个具有确定性的0和1之间的变换,到最后也能变成一场科学实验般的探索。自人们用计算机证明四色猜想以来,这个硅质人造物就充满了无限的不确定性。
AI科技评论
2021/12/10
1K0
全球首个知识增强千亿大模型——鹏城-百度·文心:不止于拼参数量,更有内涵和根基
你说我画,你画我说:全球最大中文跨模态生成模型文心ERNIE-ViLG来了!
前不久,百度产业级知识增强大模型 “文心” 全景图亮相,近日,其中的跨模态生成模型 ERNIE-ViLG 在百度文心官网开放体验入口,并放出了论文:
机器之心
2022/02/18
7290
你说我画,你画我说:全球最大中文跨模态生成模型文心ERNIE-ViLG来了!
全能大模型AIGC产品的使用体验与未来发展趋势
“全能”大模型AIGC(生成式人工智能)产品迅速涌现,为用户提供了多种多样的功能和体验。作为一名科技爱好者,我有幸尝试了多款大模型产品,并对其使用体验、选择理由以及未来发展方向进行了深入思考。本文将分享我的使用体验,并探讨未来大模型产品的发展趋势。
洛秋_
2024/07/30
1880
技术、生态和产业齐头并进,AI发展进入「深度学习+」阶段
机器之心报道 作者:杜伟 在百度 Create AI 开发者大会上,百度 CTO 王海峰提出「深度学习 +」概念,它预示着人工智能的技术创新和产业发展进入深度学习驱动的新阶段。 ‍ 自人类进入工业社会以来,每次工业革命的背后都离不开核心技术的驱动,正如机械技术、电气技术和信息技术之于前三次工业革命。如今在第四次工业革命进程中,AI 正成为核心驱动力,而深度学习是关键核心技术。 深度学习具有很强的通用性,它呈现出的标准化、自动化和模块化特征,逐渐推动 AI 进入工业大生产阶段。作为快速便捷构建、训练和部署 A
机器之心
2023/03/29
2360
技术、生态和产业齐头并进,AI发展进入「深度学习+」阶段
百度文心大模型驱动AI规模化应用,落地场景数量居业内首位
随着数据的井喷、算法的进步和算力的突破,效果好、泛化能力强、通用性强的预训练大模型(以下简称“大模型”)已成为人工智能发展的新方向。4月16日,2021百度认知AI创意赛“AI创意派”决赛正式举行,这是业内首次将先进的AI大模型能力开放给公众使用,实现了大模型在激发创意、落地应用上的突破。文心大模型首场技术开放日也同期举行,文心大模型背后的“技术天团”首次集中亮相,解读大模型无限创意背后的硬核AI技术。
用户1386409
2022/04/19
7410
百度文心大模型驱动AI规模化应用,落地场景数量居业内首位
2600亿参数,60多项任务突破,全球最大中文单体模型鹏城-百度·文心发布
从 15 亿参数的 GPT-2 到 1750 亿参数的 GPT-3,我们已经看到了模型规模增长和训练数据增加所带来的显著收益,其中最重要的一点就是对标注数据的依赖显著降低,这使得很多数据稀缺的场景也能用上性能强大的 AI 模型,为 AI 的大规模工业化应用扫清了障碍。
机器之心
2021/12/13
9630
2600亿参数,60多项任务突破,全球最大中文单体模型鹏城-百度·文心发布
以落地考验价值,大模型的产业大考来了
从 BERT 和 GPT-3 发展至今,大模型已然成为当前 AI 发展的重要方向。大模型增强了 AI 的通用性,构筑了 AI 技术和应用的坚实基座。在这股不可阻挡的大模型发展潮流中,各家大厂纷纷投入大量资金、人才和配套服务,从数据、算法和算力多方面推进大模型的研制、训练和建设。
机器之心
2022/12/16
8580
以落地考验价值,大模型的产业大考来了
大模型只有参数和算力?这款国产大模型证明:落地为王!
---- 新智元报道   编辑:好困 David 【新智元导读】搞大模型,什么最重要?突破天际的参数规模?不差钱的海量算力?还是一刷再刷的SOTA?这些可能都不是! 谁都知道,大模型是当下人工智能领域最重要的前沿技术方向。 世界上以AI为核心抓手的科技巨头,如谷歌、微软、OpenAI、英伟达等,最近几年基本上都在搞自己的大模型。 从BERT、GPT-3、再到风光无限的Switch Transformer,模型参数数量突破天际,SOTA性能记录一刷再刷。 在国内,相关方也在推出超大规模智能模型。但这些
新智元
2022/05/30
2K0
大模型只有参数和算力?这款国产大模型证明:落地为王!
百度吴甜提出大模型落地关键路径 业内首发行业大模型
5月20日,由深度学习技术与应用国家工程研究中心主办、飞桨承办的WAVE SUMMIT 2022深度学习开发者峰会在线上举办。百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜发布飞桨文心最新全景图,提出支撑大模型产业落地的3个关键路径,并在业内首发行业大模型。
用户1386409
2022/08/31
2600
推荐阅读
AI对比:ChatGPT与文心一言的异同与未来
1.2K0
​大模型进化论:AI产业落地将卷向何方?
990
AIGC时代已来,跨模态内容生成技术发展得怎么样了
7210
业界首发行业大模型,提出落地3大关键路径,百度的大模型原来是这么用的
1.4K0
ChatGPT冷观察:没有大模型的土壤,开不出ChatBot的花
4140
如何0代码、快速定制企业级NLP模型?百度工程师详解技术选型与模型调优策略
3740
强调“产品化”,大模型又卷出了新高度
4930
当被大模型输入技术内功,数字人「文画两开花」,还在手机里随时陪你聊天
6900
飞桨文心大模型挑战高考作文:平均1秒生成1篇,水平超75%考生
3880
大模型修复传世名画,飞桨帮助母羊产羔……这届百度世界大会,科技感与接地气并存
6560
大模型产业落地关键战打响!百度首发行业大模型,外加一口气十连发
4700
全球首个知识增强千亿大模型——鹏城-百度·文心:不止于拼参数量,更有内涵和根基
1K0
你说我画,你画我说:全球最大中文跨模态生成模型文心ERNIE-ViLG来了!
7290
全能大模型AIGC产品的使用体验与未来发展趋势
1880
技术、生态和产业齐头并进,AI发展进入「深度学习+」阶段
2360
百度文心大模型驱动AI规模化应用,落地场景数量居业内首位
7410
2600亿参数,60多项任务突破,全球最大中文单体模型鹏城-百度·文心发布
9630
以落地考验价值,大模型的产业大考来了
8580
大模型只有参数和算力?这款国产大模型证明:落地为王!
2K0
百度吴甜提出大模型落地关键路径 业内首发行业大模型
2600
相关推荐
AI对比:ChatGPT与文心一言的异同与未来
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档