首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Anthropic发布最强模型Claude Fable 5:几款游戏可直接体验

Anthropic发布最强模型Claude Fable 5:几款游戏可直接体验

作者头像
用户11563501
发布2026-06-23 14:16:11
发布2026-06-23 14:16:11
120
举报

刚刚,Anthropic正式发布了新一代Claude模型Fable 5和Mythos 5,这是Anthropic首个面向普通用户开放的Mythos级模型,能力超过所有此前公开的Claude版本。

由多只蝴蝶组成的数字5
由多只蝴蝶组成的数字5

Mythos级是Anthropic定义的、能力高于Opus系列的新模型层级,Fable 5和Mythos 5底层是同一个模型,仅通过安全机制做权限区分:Fable 5面向普通用户开放,内置安全防护机制,对部分高风险主题请求自动降级到次顶级模型Opus 4.8处理;Mythos 5开放全部能力,目前仅面向经审核的网络安全防御机构和生物医药研究人员,通过受信访问计划开放。

目前Fable 5已经对所有用户开放,定价为每百万输入token 10美元,每百万输出token 50美元,不到此前Mythos Preview定价的一半。

以下是Fable 5和其他头部模型的 benchmark对比:

Fable 5与其他头部模型的 benchmark对比
Fable 5与其他头部模型的 benchmark对比

核心能力提升

软件工程

测试阶段,Stripe团队测试Fable 5时,用它在5000万行的Ruby代码库中完成全库迁移,原本一个团队需要两个多月的手工工作,Fable 5只用了一天。

在Cognition的FrontierCode代码质量测试中,Fable 5拿到了前沿模型中的最高分,token效率也比过往Claude模型更高。

软件工程测试结果
软件工程测试结果
FrontierCode测试结果
FrontierCode测试结果

GitHub、Cursor、Cognition等工具团队的早期测试反馈,Fable 5能完成此前模型做不到的长周期复杂编码任务,自主性和可靠性都有明显提升。

知识工作

在Hebbia面向资深金融推理的测试基准中,Fable 5拿到了所有模型中的最高分,在文档推理、图表解读、问题解决环节提升明显。交易公司IMC测试显示,Fable 5几乎在所有交易分析评估中都拿到了高分,覆盖事实查询、概念推理、根因分析和期望价值分析等环节。

视觉能力

Fable 5是当前视觉任务的最优模型,能从精细的科学图表中提取精确数字,仅靠截图就能重构出网页应用的完整源码。

过往Claude模型即使搭配额外辅助工具也很难通关《宝可梦 火红》,Fable 5仅靠原始游戏截图,不需要任何地图导航或额外游戏状态信息,就能完整通关。

长上下文与记忆

Fable 5能在数百万token的长任务中保持聚焦,还能利用自身笔记优化输出。在《杀戮尖塔》测试中,给模型开放持久化文件记忆后,Fable 5的性能提升幅度是Opus 4.8的三倍,到达最终关卡的次数也是三倍。

以下几个示例能直观体现Fable 5的自主能力:

  • 从物理第一性原理出发构建太阳系模型,预测日食
  • 自主玩《异星工厂》,独立完成自动化工厂的策略规划和搭建
  • 在浏览器CAD编辑器中设计完整可3D打印的模型,连这个CAD编辑器本身和内置的AI建模助手都是Fable 5写的
  • 写代码实现流体模拟,还能让流体运动同步古典EDM混音的节拍,连这首混音都是Fable 5生成的

生命科学研究

Mythos 5版本已经被用于内部药物研发流程,蛋白质设计专家测试显示,模型能自主完成科学家的全部常规工作:选择结合位点、调用工具、从失败中恢复,部分环节的研发速度提升了十倍,产出质量不输给熟练的人类研究员。14个测试蛋白靶点中,有9个产出了符合药物研发要求的候选蛋白,目前已经进入后续研究阶段。

Mythos 5设计的蛋白复合物,靶点覆盖免疫检查点、神经退行性疾病相关靶点等
Mythos 5设计的蛋白复合物,靶点覆盖免疫检查点、神经退行性疾病相关靶点等

Mythos 5还是Anthropic第一个能稳定产出新颖、可信科学假设的模型。内部双盲测试中,科学家有80%的概率更偏好Mythos 5产出的分子生物学假设,部分假设已经进入实验验证。已经有一个关于大肠杆菌蛋白的新颖机制假设,被独立研究团队的预印本研究证实。

实测:从贪吃蛇到《杜伊诺哀歌》

宾夕法尼亚大学AI研究者Ethan Mollick第一时间做了实测,结果超出不少人的预期,各位可以直接点开体验。

他在自己的Substack博客提到,Fable 5的表现大幅领先他用过的所有其他公开模型。它能连续12小时按照多页的需求文档执行任务,在各类问题上都表现稳定,还出过不少让人惊讶的结果。

最有代表性的测试,是用Fable 5生成视频游戏——所有游戏,都是在Claude Code里只输入了一个初始提示生成的。

第一个是经典的贪吃蛇Snake(https://snake-stable-build.netlify.app/),操作逻辑和80年代街机完全一致:控制一条不断移动的蛇吃苹果,跑出屏幕就死亡。看起来简单,但玩起来意外上头,TechCrunch的作者也承认自己摸鱼玩了很久。

第二个是Strata(https://strata-descent.netlify.app/),玩家在无尽的地下隧道里探索,目标是点亮尽可能多的灯笼。画面质感类似早年的《神秘岛》,说不上精致,但从无到有靠一句话生成出完整可玩的游戏,这个过程本身已经足够震撼。

Mollick甚至基于莱内·马利亚·里尔克的诗集《杜伊诺哀歌》,生成了同名游戏Duino(https://duino-elegies.netlify.app/)。玩家操控孤独的行者在夜景中行走,里尔克的诗句会随着行进逐行显示在屏幕上。玩法不算丰富,但氛围和动画设计反而最让人印象深刻。

除了游戏,Mollick还用Fable 5生成了一张等时交通图(https://isochronic-passage-chart.netlify.app/#nyc),能可视化展示任意两点间的通勤时长,准确度和细节程度都相当可观。

这件事的信号很明确:过去需要一整个团队协作完成的项目,从游戏到工具,现在靠一句提示就能快速做出可用版本。对于靠创意快速试错的独立创作者来说,这是值得欢呼的进步。对于盯着AI能力曲线的创业者和从业者,这也是一个清晰的信号:行业的基础门槛,提升速度比很多人想的要快。

安全机制设计

Mythos级模型已经到了需要额外安全防护的门槛,Fable 5的核心风险来自网络安全和生物医药领域的两用性:同样的能力,合法防御者能用它发现修补漏洞,恶意用户也能用它发起攻击。

因此Anthropic给面向普通用户的Fable 5做了三层安全分类器:检测到网络安全、生物化学、模型蒸馏三类风险请求时,自动降级用Opus 4.8回复,不会让Fable 5直接输出。Anthropic数据显示,超过95%的用户会话不会触发任何降级,这些会话的使用体验和Mythos 5完全一致。

目前安全分类器做了保守设置,会误拦截部分无害请求,平均不到5%的会话会触发降级,Anthropic计划后续逐步优化减少误判。

安全分类器覆盖三个领域:

  1. 网络安全:拦截所有 offensive 网络任务相关请求,避免模型帮助恶意用户发现利用漏洞。外部红队测试和1000多小时的漏洞赏金测试,都没有发现能绕过分类器的通用越狱方法。
Fable 5安全机制测试结果
Fable 5安全机制测试结果
Fable 5与过往模型的越狱抵抗能力对比
Fable 5与过往模型的越狱抵抗能力对比
  1. 生物化学:目前拦截大部分相关请求自动降级。Anthropic测试发现,Mythos级模型仅靠通用生物推理能力,预测病毒外壳组装的准确性就超过了专门的蛋白质语言模型,这项能力可以用于基因疗法载体设计,也可能被滥用于改造危险病毒。后续Anthropic会开放受信访问计划,给合规生物医药研究人员放开Mythos 5的对应能力。
AAV病毒组装预测测试结果
AAV病毒组装预测测试结果
  1. 模型蒸馏:拦截大规模提取Fable 5能力训练其他竞品模型的请求,避免前沿能力不带安全防护扩散。

除此之外,Anthropic对Fable 5和Mythos 5的商业客户数据强制要求30天留存,仅用于安全审计检测攻击和优化误判,不会用于训练新模型,30天后会几乎全部删除。

模型对齐测试显示,Fable 5和Mythos 5的错误行为概率和Opus 4.8处于同一水平,详细测试数据可以查看[官方系统卡](https://anthropic.com/claude-fable-5-mythos-5-system-card)。

对齐测试结果
对齐测试结果

访问计划

Claude Fable 5今天已经对所有用户开放,Mythos 5目前仅对Project Glasswing的网络安全合作方开放,后续会逐步开放给经审核的生物医药研究人员,未来再扩大受信访问计划的覆盖范围。

订阅制用户的访问分阶段开放:

  • 6月9日到6月22日,Pro、Max、Team和席位制企业计划用户可以免费使用Fable 5
  • 6月23日起,Fable 5将改为按使用量计费,需要消耗使用积分,容量允许的话会延长免费使用期
  • 容量足够后,计划尽快将Fable 5重新加入订阅计划的常规内容

所有API用户目前都可以正常调用claude-fable-5模型。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-06-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI工程化 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 核心能力提升
    • 软件工程
    • 知识工作
    • 视觉能力
    • 长上下文与记忆
    • 生命科学研究
  • 实测:从贪吃蛇到《杜伊诺哀歌》
  • 安全机制设计
  • 访问计划
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档