7月6日-8日,以“智联世界 生成未来”为主题的2023世界人工智能大会在上海举行。依托年初自然语言聊天机器人ChatGPT的火爆出圈,“大模型”成为今年大会的刷屏热词。
当前,国内大模型和AGI处于怎样的发展阶段?大模型技术如何进行产业化落地? 7月7日,在2023世界人工智能大会“财联社直播间”,杭州数令集科技有限公司合伙人吕正东博士接受财联社|鲸平台记者专访,围绕“大模型的发展方向和产业落地”这一话题进行了精彩探讨。
图右为杭州数令集科技有限公司合伙人吕正东博士
吕正东博士曾任职于微软亚洲研究院,创立华为诺亚方舟实验室深度学习团队。八年前,他带领团队开发聊天机器人Neural Responding Machine,首次向世界展示了语言领域生成式模型的无限可能,Neural Responding Machine被认为是生成式对话的开创性工作及ChatGPT交互模式的前驱。吕博士在同期工作Neural Reasoner中提出的多层、同质、信息fusion的深度推理架构,同样被认为是构成如今大语言模型推理能力的核心设计之一。
作为自然语言处理方向最具影响力的华人技术专家之一,在谈及选择大模型作为创业方向的原因时,吕正东博士表示,大模型是最近15年中最激动人心的技术成果,是研究者通向人工智能甚至是AGI的最好平台。
“从去年开始,医疗健康、游戏等领域对人工智能技术的需求,极大地促进了更多人工智能技术的产业化落地。在探索的过程中,我们很快确定大模型是唯一正确的方向。在去年八月份,我们就非常笃定了。”吕正东博士说道。
Transformer的突破性架构为大模型的快速发展奠定了基础,但当前全球大模型和AGI的发展还处于早期阶段,吕正东博士认为,国内的发展更是如此。“我们还处在思考和了解的阶段,更为重要的是我们还在持续快速地更新认知。我认为,以周为单位进行更新一点也不为过”。对于未来大模型技术如何更好地进行商业化,吕正东博士认为,在中国,大模型可能还需要经历一个“退潮期”来沉淀、完善,快速去除芜杂冗余的技术旁支和商业错觉,终将凸显出有价值的方向和模式。
在本次大会举办前,有专家曾提出,当前大模型产业发展出现了同质化的倾向。对于这一问题,吕正东博士认为,市场已经出现了很多版本的大模型,未来开发者需要更多思考大模型之外的设计——如何围绕大模型来构建智能系统来解决真实世界中纷繁复杂的问题,如何让这个系统更深度地「思考」,如何更理智地决策、更有效地执行。
围绕大模型构建“解决真实世界复杂问题”的智能系统,是数令集一直坚持并努力的研究方向。吕正东博士向财联社|鲸平台记者透露,公司正在推动三个方向的产业落地:第一个方向是医疗中的心理健康,主要解决青少年心理健康问题,目前落地产品的第一阶段内测已经结束,正在多所中学和大学进行后期测试,进行最后阶段的打磨。第二个方向是高端制造,大模型主要用于梳理企业积累的海量高价值经验,对从业者进行知识辅助。第三个方向是在数令集最有经验的游戏领域,这款“重量级”产品历经多个阶段打磨,预计第一个版本将在今年底面世,让我们一起拭目以待。
领取专属 10元无门槛券
私享最新 技术干货