车内空间交互进入 2.0 时代:以对话为主,以触控为辅,大模型全链路自研
精致有料的科技报道
- shenzhenware-
在梅赛德斯奔驰宣布 ChatGPT 上车后脚,近日理想汽车在常州智能制造基地举办的首个家庭科技日上,也宣布了自家 Mind GPT 要上车的消息。
官宣消息透过理想汽车文化官方账号「有个理想」进行发布,理想汽车智能空间高管纷纷前来站台。
理想汽车智能空间负责人勾晓菲:
我们自研大模型,重构 AI 计算机时代的 OS 系统,重新定义智能空间的新一代交互,让任何人都可以轻松使用 AI。
理想汽车空间软件负责人李涛:
我们的 AI 从不刷存在感,我们在思考的是,什么是 AI,这样的价值能不能赋能于每一个人?一切都是从创造用户价值角度出发的。
理想汽车空间算法负责人陈伟:
ChatGPT 问世之前,我们就已经启动了整个大语言模型的训练。同时,我们也考虑到了多模态数据的需求,包括语音、视觉和文本等多种形式。
一系列为了用户体验、服务考量之余,相比于之前梅赛德斯奔驰与微软的强强联合,而理想汽车则更强调:
大模型的全自研。
据理想汽车透露,在此过程中,理想汽车面临众多供应商的解决方案,但最终还是选择全自研大模型这条路。用了差不多一年的时间,完成了全链路自研体系的切换。
此番理想汽车公布的大模型平台,名为 Mind GPT。
与空间交互 1.0 相比,理想汽车在三维空间的交互形式从「以触控为主,对话为辅」到本次 2.0 最大的变革「以对话为主,以触控为辅」勾晓菲谈到。
大语言模型带来对话能力上的跃迁,则为实现空间交互 2.0 蓝图提供了可能性。
究其特点,Mind GPT 具备文本生成能力、语言理解能力、知识问答能力以及逻辑推理能力,大模型在回答问题时能够给出推导过程,并且越来越接近人类思考方式。
除常规的推理优化外,理想汽车还支持使用控制器单元模型(Controller)来连接外部能力,比如自研搜索引擎,以获取实时信息。
交互入口仍然为车载语音助手「理想同学」,基于大模型 Mind GPT 能力,带来了全新的「记忆网络」能力。
日常沟通使用过程中,「理想同学」可以描绘用户画像,并把这些信息带入到与用户的对话过程中,给与用户个性化的交互体验。
同时,还新增了 LUI(用户语言界面)交互方式,即自然语言交互的方式与计算机进行交流的用户界面。
实际可以呈现的体验为,比如:
当用户想吃火锅,在告诉「理想同学」后,车机界面就会生成火锅图片供选择,并自动规划出行路线等操作。
此外,还进一步提升「理想同学」服务的准确度。通过设定函数的边界和不允许超过的范围,防止误调用。比如:
在大热天用户误说给座椅加热,「理想同学」也会理解用户的意图、情感或需求,get 到座椅通风真实需求,并友好地纠正并打开座椅通风。
通过大模型 Mind GPT 的加持,理想汽车希望重点去提升「理想同学」的理解与表达能力,带来一个全新的对话、交互、沟通的界面。
而实现以上的根本,理想汽车认为必须坚持全链路自研。
对此,你怎么看?■
领取专属 10元无门槛券
私享最新 技术干货