首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >开源Computer Use模型Holo3.1发布,35B版性能超Qwen3.5、Kimi K2.5与Claude Sonnet 4.6

开源Computer Use模型Holo3.1发布,35B版性能超Qwen3.5、Kimi K2.5与Claude Sonnet 4.6

作者头像
用户11563501
发布2026-06-23 14:13:58
发布2026-06-23 14:13:58
100
举报

6月2日,法国AI公司H Company推出Holo3.1系列开源计算机控制大模型。这是继两个月前Holo3发布后,该团队针对生产环境反馈优化的版本,核心解决此前计算机控制AI代理(Computer-use Agent)普遍存在的云部署延迟高、成本高、数据隐私风险的问题。

Holo3.1基于Qwen架构开发,专门针对GUI理解、屏幕操作、任务规划、跨应用导航等计算机控制场景做了微调,和通用大模型相比,在真实本地GUI任务中的表现更突出。同时原生支持函数调用协议,可无缝接入第三方AI代理框架,适配不同生产环境的部署需求。

整个系列覆盖0.8B、4B、9B、35B四种参数规格,提供NVFP4、FP8、Q4 GGUF三种量化版本,可完全离线运行在MacBook、Windows PC、DGX Spark等设备上,所有运算与数据均不离开用户本地环境。

官方给出的基准测试数据显示,Holo3.1 35B版本整体性能达78.3%,OSWorld基准80.0%,AndroidWorld基准79.3%,全面超过Qwen3.5-397B、Kimi-K2.5、Claude Sonnet 4.6等主流模型。哪怕是4B、9B的小参数版本,AndroidWorld基准成绩也达到71%,足够覆盖多数简单自动化场景。

速度方面,量化优化的提升体现在实测数据中。在DGX Spark设备上使用Fast harness调度,NVFP4量化的35B版本每分钟可处理18.1个请求,是FP8版本的1.5倍,全精度BF16版本的1.74倍,而OSWorld基准成绩仅比BF16版本低2个百分点,几乎无感知损失。

消费级硬件也可直接部署:Q4 GGUF版本的35B模型可在苹果硅Mac、普通Windows PC上运行,小参数版本甚至有望适配移动端神经引擎。官方提到,配合后续将推出的桌面代理调度工具,端到端操作延迟可从6.8秒压缩到3.3秒。

目前所有Holo3.1模型权重已在Hugging Face开放下载,35B版本采用Apache 2.0协议完全开源,可免费商用。官方同时提供API服务,免费 tier 支持每分钟10次请求,无需绑定信用卡;付费版输入token定价为每百万0.25美元,输出token每百万1.8美元,上下文长度65536,支持最多5张1080P图像输入。官方明确API默认不保留用户的提示词与返回结果,仅记录请求时间、模型与token数量等基础日志信息。更高性能的122B版本为研究授权,仅对付费用户开放,适用于复杂多步操作场景。

该模型发布后引发开发者社区关注。有开发者提到,此前云端代理的延迟和成本足以抵消多数自动化收益,本地高吞吐量的计算机控制模型才是AI代理真正进入日常工作的核心前提。也有开发者表示,4B小参数版本的表现超出预期,有望在端侧设备上实现可用的AI操作功能。

相关链接:

  • 官方技术博客:https://hcompany.ai/holo3.1
  • Holo模型API:https://hcompany.ai/holo-models-api
  • Hugging Face下载地址:https://huggingface.co/collections/Hcompany/holo31
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-06-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI工程化 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档