最近,AutoGLM 刷屏了各大社交平台,我随即去看了一下它的介绍视频。这不正是我一直梦寐以求的 AI 智能助手吗?
只需一句简单的指令,就能控制手机或电脑上的软件,执行各类操作。这不就是电影《钢铁侠》里的“贾维斯”吗?难道我们真的要迎来一个 AI 超越未来的时代了?
从官方介绍来看,AutoGLM 已经能够帮助用户完成诸多日常任务,比如:
目前,AutoGLM 已适配微信、淘宝、美团、小红书、大众点评、12306、携程和高德地图等 8 款常用应用,基本覆盖了日常生活所需的核心软件。此外,它还能执行更多高阶操作,比如朋友圈点赞、抢车票、订门票等。
在 AI 代理(Agent)领域,AutoGLM 不是唯一的探索者。例如,Claude 近期推出的“Computer Use”功能,展现了一种不同的 AI 交互方式。
Claude 的 Computer Use 让 AI 能够像人类一样操作电脑,它可以:
这意味着,Claude 主要专注于 PC 端的自动化操作,例如办公自动化、编程辅助等任务。
相比之下,AutoGLM 的重点在于移动端交互,核心优势包括:
换句话说,Claude 的 Computer Use 是“让 AI 操控你的电脑”,而 AutoGLM 则是“让 AI 操控你的手机”,两者在应用场景上形成互补。
自 2022 年 ChatGPT 横空出世以来,大模型的发展已经进入白热化阶段。然而,从实际体验来看,各大模型的能力差距正在缩小,仅仅提升参数规模已无法带来革命性突破。
因此,AI 的下半场竞争,很可能聚焦在 AI Agent 能力上。
例如,阿里近期发布的 Qwen2-VL 多模态模型,展示了 AI 结合视觉信息、执行实际任务的能力。
在 Qwen2-VL 的演示中,用户上传了一张航班信息图片,并询问目的地的天气。AI 先解析图像文字,再自动调用天气 API,返回对应信息。
更复杂的任务场景下,AI 还能执行网页搜索、筛选信息、自动填写表单等操作。例如,在 San Diego 查找餐厅时,AI 能够:
这种能力,正是 AI Agent 未来的发展方向——从被动应答升级为主动执行。
AI 发展至今,已经从“智能助手”向“智能代理”演进。AutoGLM 的出现,标志着 AI 迈入一个全新阶段:不仅能回答问题,还能帮你操作设备、执行任务。
未来,我们可以期待 AI 在手机端拥有更强的自主决策能力,让设备真正成为个人智能助理。而这一切,或许只是 AI 变革的开始。
你期待 AI 还能做些什么?欢迎留言讨论!
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。