首页
学习
活动
专区
圈层
工具
发布

Claude Opus 4.8发布,官方预告Mythos快来了

AIPress(AI普瑞斯)

Anthropic 正式发布 Claude Opus 4.8,价格与上代保持不变。

Opus 4.8 还与几个新功能一起发布:

claude.ai 上的用户现在可以控制 Claude 在任务上投入的推理强度。

Claude Code 具有新的“动态工作流程”功能,使其能够解决非常大规模的问题。

Opus 4.8 的快速模式——该模型可以以2.5倍的速度工作——现在比以前的型号便宜三倍。

Opus 4.8 全面领先前代

Opus 4.8 在编码、代理技能、推理和实用知识工作任务测试方面与其他模型的比较。

Opus 4.8 全面领先 4.7,大多数项目也超过 GPT-5.5 和 Gemini 3.1 Pro。

最大改进是诚实

官方称 Opus 4.8 最突出的改进之一是它的诚实。

早期测试人员报告说,Opus 4.8 更有可能标记其工作的不确定性,不太可能提出未经证实的声明。这一点在评估中得到了证实,这些评估表明,Opus 4.8 允许其编写的代码中的缺陷不经人评论的可能性比其4.7低四倍左右。

评估还显示,Opus 4.8 的错位行为(如欺骗或合作滥用)率大大低于 Opus 4.7,与自家最佳对齐模型 Claude Mythos Preview 相似。

Anthropic 提到自家最强模型 Claude Mythos Preview,已经在少数公司在用,预计在未来几周内将 Mythos 级模型带给所有客户。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OL83aE2f76F8VO9EJS_HlBxg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券