Agent市场再添新动态,AI能够实现一句话面对面建群、发红包了。
11月29日,在智谱Agent OpenDay上,智谱CEO张鹏通过下达一个简单语音指令,就让智谱旗下自主任务完成智能体AutoGLM,给在场数百位嘉宾现场发送了“一个来自 AI 的微信红包」”。
张鹏表示,Agent正在让大模型从对话(Chat)走向操作(Act),从生成式 AI迈向代理式 AI,人类与机器的互动方式也在发生范式转变。
据他介绍,自智谱10月份率先开放AutoGLM的内测以来,该智能体产品已经受到非常多的关注和反馈。“发布后的一个月内,我们的申请页面已经有超过100万的用户访问,其中,有网约车司机使用它导航;有盲人程序员每天使用它料理生活;也有很多忙碌的白领拿它出差订票和点外卖……”张鹏说。
而在这次大会上,作为最早探索 Agent 的大模型企业之一,智谱也带来了多个新进展:
AutoGLM 可以自主执行超过 50 步的长步骤操作,也可以跨 app 执行任务。
AutoGLM开启「全自动」上网新体验,支持数十个网站的无人驾驶。
像人一样操作计算机的GLM-PC 启动内测,基于视觉多模态模型实现通用Agent的技术探索。
张鹏宣布,AutoGLM将启动大规模内测,并将尽快上线成为面向 C 端用户的产品。AutoGLM 也将启动「10个亿级 APP 免费 Auto 升级」的计划,邀请App伙伴联合探索自己的 Auto 新场景。
另外,即日起智谱清言插件也将上线 AutoGLM 功能,支持搜索、微博、知乎、Github 等数十个网站的无人驾驶。
除了手机端和浏览器端,PC端的自主Agent也有了新动向,智谱推出了面向“无人驾驶”PC的GLM-PC,其基于智谱的多模态模型 CogAgent,目前开放第一阶段的内测场景包括:帮用户预定和参与会议,发送会议总结;文档处理;网页搜索与总结;远程手机发指令,GLM-PC 可以自主完成电脑操作等。该产品目前也已经开启内测。
除了智能体产品能力的更新,这次大会上,张鹏还公布了智谱定义的大模型发展五个阶段。
与 OpenAI 的定义有所不同,智谱定义的五个阶段包括:L1 语言能力、L2 逻辑能力(多模态能力)、L3 使用工具的能力、 L4 自我学习能力、 L5 探究科学规律。
“发展至今,大模型已经初步具备了人类与现实物理世界互动的部分能力。而Agent 将极大地提升 L3 使用工具能力,同时开启对 L4 自我学习能力的探索。” 张鹏说。(数智前线/周享玥)
领取专属 10元无门槛券
私享最新 技术干货