原创丨作者:罗超
“搜索是AI规模最大的应用场景”,在日前举办的WISE2022新经济之王大会上,百度集团资深副总裁、百度移动生态事业群组(MEG)总经理何俊杰表示,目前,百度搜索、百度APP是AI规模最大的应用场景,随着AI预训练大模型、AIGC、数字人等新技术的规模化落地,其AI带来的创新优势将更加凸显。
近十年来,AI与搜索结合得愈发紧密,AI从搜索获取数据和反馈不断进化,反过来也在大幅提升搜索的智能化水准,两者形成类似于DNA的“双螺旋”结构,可谓取之于搜索也用之于搜索。
当AI技术渗透到千行百业的传统产业时,它在互联网业务上也一直在持续落地,搜索引擎就是最重点的一个场景,也可以说是目前应用最早、最广的场景。
搜索引擎进入AI大模型时代
作为最广泛的基础互联网应用,搜索一直伴随用户左右,也正因为此,它日积月累的进化很难被用户感知。不过,如果将时间线拉长,人们将很容易感受到这样的变化。把同一个关键词键入搜索引擎,今天的搜索结果和10年前的已大不一样。
10年前PC时代的搜索引擎长什么样?联想一下我们用得最多的百度:简洁的白色页面有一个搜索框,键入关键词后,就会得到一个网页列表,而决定用户体验的只有一个因素:结果是否足够多,排序是否足够准。彼时的搜索引擎背后的原理也相对简单:爬虫服务器持续爬取海量网页内容形成“关键词-结果页”的索引数据库,搜索引擎收到请求后拆解关键词再到索引数据库查找答案,根据算法对结果进行筛选、排序,最后给出用户看到的搜索结果页。
不过,今天在人们普遍使用的百度App,搜索结果页已不再是简单的网页列表,而是个性化、智能化的聚合内容,比如搜索“马云”,聚合页除了马云的百科、新闻,还有相关的互联网大佬,马云演讲视频等等;再比如搜“天气”,我可以看到身处地广州的天气组件,以及科普、天气小程序等等。
除了搜索结果页面更个性化外,搜索也更能理解用户的问题了。
用户可以像问身边朋友一样用口语提问,比如“韩国有部电影野兽轮船在空中飘着叫什么名字”,搜索引擎可基于深度语义理解问题并匹配答案。
用户可以直接搜索导购这样的服务,比如问“智能锁哪个品牌好”,结果中就是品牌榜单。
搜索还能理解视频内容,基于AI可智能节选视频中能够回答搜索问题的片段。比如当用户问“扬子鳄多长”时,就能得到更直观的视频内容。
今天用户使用百度App已不再需要任何“专业搜索技巧”就能进行“傻瓜式”提问。除文字外,用户也可以图片、声音进行更简单的搜索,在语音搜索这一功能上,除了普通话外,百度App还支持了粤语的提问与回答。中华语言博大精深,有些地方还有“五里不同音,十里不同调”的说法,百度App未来支持更多方言是可预见的。
上面这一切的搜索进化都得益于AI技术的应用。AI技术一方面更好地理解内容,另一方面更好地理解用户搜索请求,结果就是可以给出更加精准的答案,这对移动搜索至关重要。随着IoT时代搜索入口的多场景化,用户对搜索的准确性要求越来越高,比如语音助理就只会给搜索引擎一次回答机会。因此搜索的终极发展目标是只给用户一个答案——他最需要的答案,少即是多。要做到这一点很难,但方向却一直都很明确:做AI技术驱动的搜索引擎,这正是百度搜索这10余年进化的方向。
这两年,在深度学习经过10余年发展后,预训练大模型成为AI产业新的技术热点。由于工业化阶段的AI需支撑更广泛普适的场景、满足更大更复杂的AI计算需求,人工标注的数据模型训练模式已捉襟见肘,具有“巨量数据、巨量算力、巨量算法”特性的AI预训练大模型成了产业智能化的基础工具,其可采取自监督学习的方式对海量无标注数据中的规律和知识进行提炼、学习。百度、谷歌等巨头的探索表明,基于预训练大模型的NLP技术的效果已超过过去最好的机器学习能力。2022年红极一时的AI作画、AI作文、AI外交官等应用,背后都是AI大模型在驱动。
百度也已将AI大模型应用在搜索这一核心业务中,在2022年万象大会上,百度发布了跨模态大模型“知一”和新一代索引“千流”。“知一”可理解视频、文字、图片、信息流等全网形态各异的资源,使得搜索不再受限于信息的形态。“千流” 则可对海量内容进行索引,更快地筛选出搜索相关的答案,相较于传统搜索引擎而言,成本降了一半、速度快了两倍。
在“智能搜索+智能推荐”的双引擎模式下,百度搜索每天响应来自100多个国家、几十亿次的搜索请求。由于搜狗等老牌搜索玩家出局,很多人以为搜索行业在走下坡路。但百度数据却给出了相反的结论。百度财报显示,今年9月百度App MAU已达到6.34亿,同比增长5%。而据何俊杰在WISE大会上介绍,“过去一年,百度搜索的规模有增无减,年同比实现了17%的增长。百度APP也强劲增长,第三季度移动端搜索查询次数同比实现两位数的增长,百度App信息流内容分发量同比增长23%。”
搜索引擎是最古老的互联网应用之一,到今天为止也是最基础的互联网应用之一。从百度给出的最新数据来看,搜索引擎“国民刚需应用”的属性并未改变。不论短视频、直播等媒体内容形态如何变迁,人们都需要用搜索。而从百度发布的跨模态大模型“知一”和新一代索引“千流”来看,搜索引擎一直都在“吃”着最前沿的AI技术,不断进化。
何俊杰说“搜索已经成为AI规模最大的应用场景”,这可能在一些人的意料之外,但在罗超频道看来却是情理之中。一直以来,搜索都是AI最核心的练兵场。AI技术生于实验室,但却发展于搜索。时至今日,搜索引擎仍旧是AI技术的核心练兵场。
搜索是AI的核心练兵场
AI有着多年发展历史,1982年物理学家约翰·霍普菲尔德就发明了Hopfield神经网络,1986年深度学习之父杰弗里·辛顿提出BP算法加速了神经网络发展,不过因为缺乏对应的算力、场景与数据,AI并未迎来爆发。2012年前后随着谷歌大脑项目被曝光,深度学习开始为大众关注。此后,深度学习算法在图像识别等应用中不断取得进展,2016年谷歌AlphaGo击败人类让其一战成名。
不过AI技术真正大规模商用,最先还是从搜索引擎开始的。在谷歌大脑启动的同一时间,国内的搜索巨头百度也在积极探索AI,只不过它最先没将AI应用到图片识别或者下棋上,而是从自然语言处理开始的,这是搜索的基础技术之一。2010年百度成立以“理解语言,拥有智能,改变世界”为使命的自然语言处理部(NLP),此外还有互联网数据研发部(包括知识图谱和互联网数据挖掘)、推荐引擎和个性化部、多媒体部(包括语音和图像技术)、图片搜索部、语音技术部等,这些部门研发的技术都是AI强相关,特别是自然语言处理技术,更是被视作是人工智能皇冠上的明珠。
2013年百度又正式成立了深度学习实验室(IDL)。当2014年李彦宏宣称“百度大脑智力已接近三岁小孩”时,AI技术已在百度被大量应用,语音搜索、图像搜索、百度翻译、百度地图…都有大量人工智能技术支撑,即便是最简单的文字搜索,百度的结果也变得更准,因为在AI驱动下它可以更好地理解用户需求与理解海量内容。2016年深度学习被坊间热议时,百度已经走出很远。
AI率先在搜索引擎场景大规模商用并不让人意外。
第一,AI与搜索都具备“数据驱动”的本质。AI技术的出现给搜索引擎带来了全新的可能:基于海量数据训练的模型让搜索引擎“自学习”,进而更好地理解需求和内容,给用户带来更好的体验。
第二,AI与搜索的终极目标都是具备“认知”能力。
图像识别、语音识别等AI技术只有“感知”能力,是弱人工智能,但强人工智能需要机器具有认知能力,也就是知识获取与应用的能力。知识对搜索也是基石般的存在,当前谷歌、百度等主流搜索的底层也都有一个巨大的知识图谱,它们进化的主要方向就是基于AI技术不断强化认知能力。
第三、几乎所有AI技术都能在搜索找到应用场景。
搜索引擎不等于一个搜索框。今天的搜索已无处不在,除了智能手机、PC等传统设备外,智能音箱、智能汽车、智能家居、可穿戴设备等等智能设备都有大量的搜索应用。大量的搜索场景给AI技术创造了大量应用空间,语音、图像、智能预测、智能翻译、智能推荐、数字人、AIGC等AI技术都已在搜索引擎上落地。
AI在搜索引擎得到了大规模商用,同时也扩散到了社交IM、信息流、短视频、美图、在线教育等等互联网应用,如今则渗透到更多行业成为各行各业数智化基础设施。在从搜索这一“圆心”不断扩散出到更多“圆圈”的过程中,AI也在数据与场景的反哺下不断进化,先后出现了深度学习框架、预训练大模型等重磅AI技术。如今搜索依然是AI的核心应用场景。
为什么搜索引擎也能扛起AI创新应用的大旗?
很多人觉得自动驾驶、智能交通、工业互联网等产业场景才是“AI密集型产业”,实际上搜索引擎也属于AI创新应用的排头兵。从一开始,搜索就是AI最核心的场景,因此在全世界范围内AI最强的公司,都是以搜索引擎为主业的公司,比如国外的谷歌,国内的百度。在被腾讯收购前搜狗也是国内AI行业的强势玩家,腾讯吞下它更多是看中它在搜索与输入法中锤炼出来的NLP、知识图谱、语音等AI技术。
做好AI不只是要有强大的算法,更要有大规模可商用的场景,场景意味着数据意味着反馈。做AI最早的是科技巨头是IBM。1997年它研发的计算机“深蓝”(Deep Blue)战胜了国际象棋冠军卡斯帕罗夫;2011年又研发了沃森超级计算机,作为一个有10台普通冰箱那么大的计算机系统,其在AI上的表现还不如Siri。IBM做AI很早却不能进入第一阵营?因为没有场景,没有数据,没有反馈。
在WISE大会上,何俊杰也谈到了反馈对技术创新的重要性,他甚至表示百度能持续实现科技创新的心法就是“反馈驱动创新”,只有“市场不断地在给你反馈,你才有机会去一步一步地往前走,实现创新。”由此可以看出,倘若一项技术走不出实验室,不能落地到应用场景,很可能就是闭门造车。而当技术成功走出实验室,它就可以在场景中不断得到反馈,得到反哺,得到进化。这一点也是百度搜索可以成为最大的AI应用场景的关键。
为什么百度搜索成了AI规模最大的应用场景,并扛起AI创新应用的大旗,有几点核心原因:
1、AI技术必须要在真实场景中锤炼,通过“吃数据”不断进化。AI的四要素是算力、算法、数据和场景。不论是AI芯片、深度学习平台、大模型还是语音等AI应用算法,都需要真实场景的数据反哺。百度搜索是国民级互联网应用,百度APP拥有6.34亿月活,百度搜索每天响应几十亿次的搜索请求。此外,随着万物互联时代到来,搜索已从“搜索框”走向“无处不在”,呈现出多场景、多设备、多入口的特征,从小度智能音箱、Apollo无人驾驶车、小度添添智能健身镜,到百度App、百度地图、好看视频、百度贴吧、百度输入法、百度网盘、百度健康、YY直播以及百度生态中的海量互联网应用,再到数字人、元宇宙……百度智能搜索已服务于用户生活的方方面面,包括家庭、工作、出行、娱乐到虚拟等全部场景。也正因为此,何俊杰才有底气说,百度移动生态拥有“离用户最近的一个反馈窗口,能够不断的检验新技术、新产品。”
2、百度深耕AI 10余年,练就了一身AI真功夫。
百度2010年成立多个AI相关团队的目的均是为了改进搜索,可以说百度是最早做AI+搜索场景的。
此后10余年,百度将AI当成公司核心战略,在前段时间的2022联想创新科技大会上,百度创始人、董事长兼首席执行官李彦宏透露了一组关键数据:“作为一家技术公司,百度过去十年累计研发投入超过1000亿元。”而千亿级巨量资金,均被投入到AI前沿、底层技术以及相关应用技术的研发中。
当然,百度千亿的AI投入不只是全部被应用到AI搜索上,除昆仑AI芯片、飞桨深度学习平台、文心AI大模型等AI基础组件外,还有AI与量子计算、科学计算、生物计算、航空航天等前沿技术的融合,以及依托百度智能云所推动的AI产业化应用。但这些年百度一直都没停下来的一件事,就是持续探索AI与搜索的结合。从底层芯片到预训练大模型再到上层算法应用,百度全栈自研的AI能力都会被率先应用在搜索场景。
比如今年上线百度App的个性化AI伙伴度晓晓,它底层是文心大模型在驱动,也是百度在数字人上的最新技术成果。作为国内首个可交互虚拟偶像,它可在百度APP给用户提供全程AI陪聊式交互搜索功能,刷新了搜索体验。
百度为何总会搜索这一“本业”上先大规模应用一项AI技术?除了搜索引擎本就是AI天然的“练兵场”外,我认为百度此举一箭双雕:
一方面AI技术加持可直接提高搜索体验,不论是更准确的搜索还是更创新的搜索,都可助其强化在搜索行业的地位,巩固核心业务就能稳住基本盘。何俊杰说,百度做AI“能攀珠峰,就不爬玉龙雪山。”通过压强式、马拉松式的投入,百度人工智能的各个层面都有领先的自研技术。百度搜索则“近水楼台先得月”,率先应用其强大的AI技术不断进化,日拱一卒升级体验,我想这是百度搜索这些年来稳居中文搜索一哥位置的关键所在。
另一方面,在溢出效应下,将AI技术开放给产业已成为百度新的增长曲线,其Q3财报里智能云、智能交通等业务都已在贡献增量。而经过大规模C端消费级应用“验证”与“锤炼”的AI技术,在开放给产业时也更具竞争力、号召力与吸引力,这跟阿里云强调其技术是“双11同款”的道理是一样的。
以昆仑芯片为例,作为中国第一款自研云端全功能AI 芯片,其在国产芯片、AI芯片领域已成为领先IP。为什么可以?这一点何俊杰给出了解释:昆仑芯片前端有一个巨大的应用“搜索”,可以基于反馈,实现端到端的优化,比如昆仑1代已在百度搜索引擎、小度等业务中部署超过2万片,服务50多家外部客户,是国内唯一一款经历过互联网大规模核心算法考验的云端 AI 芯片。“在搜索这样国民级产品实时、海量的反馈下,新技术、新产品就不只有实验室里的理论高度,还有大市场里的实践力度。”
百度早已从搜索引擎升级成AI公司,但这并不意味着百度不做搜索了,相反,百度是真的将“AI+搜索”这件事给做透了,搜索与AI形成了很强的协同效应,两者都受益。
3、百度不只是搜索引擎,更是超级内容平台。
移动时代不同平台都在建篱笆,将内容圈起来,这对搜索引擎不是好消息。好在百度很早就未雨绸缪,一方面通过投资、合作、小程序等手段不断聚拢第三方内容;另一方面则持续完善自有内容生态,构建超级内容平台。在搜索与信息流的双引擎分发机制下,百度移动的内容生态已涵盖第三方网站/app、百家号/好看视频创作者、小程序、托管页等各式各样的内容供给。
如何让内容生态更有活力?提供更强的创作工具帮助创作者降本增效、创作创新至关重要。在这一点上百度的答案是AIGC,也就是AI创作内容,这里的一个技术背景是AI技术正在从感知到认知进化。
在预训练大模型加持下,AI将有望从弱AI进入到强AI时代。相较于图像识别、人脸识别、语音助理强调“感知”而言,强人工智能更需要“认知”,不只是可以理解内容(图片、文字、视频等等),还能创作内容,今年爆发的AI作画、AI作文都属于典型的强AI应用,这需要AI具有一定的认知能力,而认知的底层是“知识”而不只是“数据”,这正是搜索引擎以及百度的长处,百度知识图谱早在2014年上半年就已开始提供线上服务,基于飞桨训练的文心大模型也具有“知识增强”这一差异化特性。
在AI文心大模型加持下,2022年高考期间,度晓晓挑战高考作文,得分超过了75%的高考考生,也就是说在“作文”水平上,AI可能已经超过大部分人的水平了。AI创作内容除可助力百度移动生态创作者生产更好内容外,未来还可纠错内容、聚合内容,升级用户搜索体验。
除了AI作文外,AI制作视频已在百度APP大规模应用,有些视频内容是AI从百家号的图文内容自动转换过来的,笔者的百家号“罗超频道”已开启这一功能,发布内容后很快就会自动生成图文并茂还有配音的视频,前段时间甚至有同行问我,为什么写文章了能这么快地做视频?是不是有团队?我告诉他是AI生成的,这表明AI生成视频这个技术已经比较成熟了。
作为一名创作者,我坚信AI不可能完全取代创作者,但大幅提高创作者效率却是可以期待的,何俊杰在WISE大会上也表示:“未来,AIGC 将颠覆现有内容生产模式,可以实现以十分之一的成本,以百倍千倍的生产速度,创造出有独特价值和独立视角的内容。”
何俊杰介绍,百度发布了“创作者AI助理团”,基于AI技术可实现从文案、图片到图文转视频的自动化创作。百度认为创作将迎来“人机共创”模式,媒体、创作者可以进一步把宝贵的精力专注用在创造力上,创作者们能实现“一个人就是一支队伍”,互联网的内容生态也会因此发生新的革命。
2022年流行的数字人也是百度移动生态AI创新的一大看点。今年9月百度百家号推出了数字主持人解决方案,已有多家媒体机构率先应用,比如中国青年报和中国青年网官方短视频品牌“青蜂侠”,就依托百家号平台推出了数字主持人“青小霞”,其可高度复刻真人主播的声音及表情动作,实现高质多量的内容生产和播报,降低媒体运作和内容生产成本。
何俊杰在WISE大会说,百度要让内容创作者实现“数字人自由”,将陆续开放更多“数字人能力”,进一步降低“人均一个数字人”的成本。如果数字人自由变为现实,以后很多创作者都可以拥有自己的数字人主播,善于写作不善于出镜的可以做直播,主播也可在自己睡觉时让“虚拟分身”“不间断直播带货”了。
从文章创作到视频生成再到数字人,百度针对创作者推出了一套AIGC的组合拳,此举势必让其内容供给高质量增长,形成更多创新、优质、差异内容,给用户更好的搜索体验。
写在最后:
关于创新行业有很多说法,比如微创新、渐进式创新、颠覆式创新等等。而在WISE大会上,何俊杰则谈到了百度的创新观:“反馈驱动创新”。
百度做AI创新,既要攀珠峰(实现技术创新和突破),也要接地气(从用户侧吸收反馈),还要持久战(与生态伙伴一起长效经营)。而搜索引擎是百度与用户最近的窗口,是其获得市场反馈的一线。如今AI工业化时代来临,从搜索开始爆发的AI正在加速走向千行百业,越来越多的AI应用在涌现甚至成为人们生活与工作的一部分。但在可见的未来,搜索依然会是最核心且最大的AI应用场景。在AI技术加持下,结合大规模用户场景的“反馈驱动创新”,搜索引擎未来也一定会给用户、给行业、给AI产业带来更多可能。
END