首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >刷新 SOTA!美团 EvoCUA:能操作电脑的 AI 智能体

刷新 SOTA!美团 EvoCUA:能操作电脑的 AI 智能体

作者头像
用户12558604
发布2026-06-17 19:30:21
发布2026-06-17 19:30:21
50
举报

说实话,现在不少大模型看着本事不小,聊天、推理样样都行,可真让它上手操作电脑,那表现是真的拉胯。我之前也试过几款类似的电脑操作工具,要么压根摸不透各类软件的操作逻辑,要么点来点去没实际反应,反倒越帮越忙。琢磨了好久才发现核心问题就两个:一是没有高质量的操作数据供它训练,练手的底子本身就差;二是操作出错后完全没有反馈机制,它根本不知道自己错在哪,自然也就没法针对性改进。

随着大模型的不断发展,大家对AI的期待早就不只是能答问题,更希望它能实打实解决工作里的实际问题——比如自动处理Excel表格、在浏览器中完成复杂的资料检索,甚至实现跨应用的协同操作。这种需求也推着基础模型从只会对话的“聊天搭子”,慢慢变成能动手做事的Agent(行动者)。

而Computer Use Agent(CUA,计算机操作智能体),就是这一转变过程中的关键里程碑。它打破了传统API的限制,构建出一种更原生的交互方式:能像人类一样,通过高分辨率视觉感知电脑屏幕,再用鼠标和键盘完成跨应用的长链路操作,甚至有可能成为下一代操作系统的核心交互入口。

而美团最新开源的EvoCUA,就精准解决了此前电脑操作AI的这些核心痛点,表现亮眼。

使用示例

Github地址:https://github.com/meituan/EvoCUA

Huggingface可下载对应模型:EvoCUA-32B、EvoCUA-8B

#美团 #能操作电脑的AI智能体 #智能体 #AI

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-03-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 编程拾光 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档