Anthropic发布最强模型Claude Fable 5：几款游戏可直接体验

用户11563501

发布于 2026-06-23 14:16:11

5030

刚刚，Anthropic正式发布了新一代Claude模型Fable 5和Mythos 5，这是Anthropic首个面向普通用户开放的Mythos级模型，能力超过所有此前公开的Claude版本。

Mythos级是Anthropic定义的、能力高于Opus系列的新模型层级，Fable 5和Mythos 5底层是同一个模型，仅通过安全机制做权限区分：Fable 5面向普通用户开放，内置安全防护机制，对部分高风险主题请求自动降级到次顶级模型Opus 4.8处理；Mythos 5开放全部能力，目前仅面向经审核的网络安全防御机构和生物医药研究人员，通过受信访问计划开放。

目前Fable 5已经对所有用户开放，定价为每百万输入token 10美元，每百万输出token 50美元，不到此前Mythos Preview定价的一半。

以下是Fable 5和其他头部模型的 benchmark对比：

核心能力提升

软件工程

测试阶段，Stripe团队测试Fable 5时，用它在5000万行的Ruby代码库中完成全库迁移，原本一个团队需要两个多月的手工工作，Fable 5只用了一天。

在Cognition的FrontierCode代码质量测试中，Fable 5拿到了前沿模型中的最高分，token效率也比过往Claude模型更高。

GitHub、Cursor、Cognition等工具团队的早期测试反馈，Fable 5能完成此前模型做不到的长周期复杂编码任务，自主性和可靠性都有明显提升。

知识工作

在Hebbia面向资深金融推理的测试基准中，Fable 5拿到了所有模型中的最高分，在文档推理、图表解读、问题解决环节提升明显。交易公司IMC测试显示，Fable 5几乎在所有交易分析评估中都拿到了高分，覆盖事实查询、概念推理、根因分析和期望价值分析等环节。

视觉能力

Fable 5是当前视觉任务的最优模型，能从精细的科学图表中提取精确数字，仅靠截图就能重构出网页应用的完整源码。

过往Claude模型即使搭配额外辅助工具也很难通关《宝可梦火红》，Fable 5仅靠原始游戏截图，不需要任何地图导航或额外游戏状态信息，就能完整通关。

长上下文与记忆

Fable 5能在数百万token的长任务中保持聚焦，还能利用自身笔记优化输出。在《杀戮尖塔》测试中，给模型开放持久化文件记忆后，Fable 5的性能提升幅度是Opus 4.8的三倍，到达最终关卡的次数也是三倍。

以下几个示例能直观体现Fable 5的自主能力：

从物理第一性原理出发构建太阳系模型，预测日食
自主玩《异星工厂》，独立完成自动化工厂的策略规划和搭建
在浏览器CAD编辑器中设计完整可3D打印的模型，连这个CAD编辑器本身和内置的AI建模助手都是Fable 5写的
写代码实现流体模拟，还能让流体运动同步古典EDM混音的节拍，连这首混音都是Fable 5生成的

生命科学研究

Mythos 5版本已经被用于内部药物研发流程，蛋白质设计专家测试显示，模型能自主完成科学家的全部常规工作：选择结合位点、调用工具、从失败中恢复，部分环节的研发速度提升了十倍，产出质量不输给熟练的人类研究员。14个测试蛋白靶点中，有9个产出了符合药物研发要求的候选蛋白，目前已经进入后续研究阶段。

Mythos 5还是Anthropic第一个能稳定产出新颖、可信科学假设的模型。内部双盲测试中，科学家有80%的概率更偏好Mythos 5产出的分子生物学假设，部分假设已经进入实验验证。已经有一个关于大肠杆菌蛋白的新颖机制假设，被独立研究团队的预印本研究证实。

实测：从贪吃蛇到《杜伊诺哀歌》

宾夕法尼亚大学AI研究者Ethan Mollick第一时间做了实测，结果超出不少人的预期，各位可以直接点开体验。

他在自己的Substack博客提到，Fable 5的表现大幅领先他用过的所有其他公开模型。它能连续12小时按照多页的需求文档执行任务，在各类问题上都表现稳定，还出过不少让人惊讶的结果。

最有代表性的测试，是用Fable 5生成视频游戏——所有游戏，都是在Claude Code里只输入了一个初始提示生成的。

第一个是经典的贪吃蛇Snake(https://snake-stable-build.netlify.app/)，操作逻辑和80年代街机完全一致：控制一条不断移动的蛇吃苹果，跑出屏幕就死亡。看起来简单，但玩起来意外上头，TechCrunch的作者也承认自己摸鱼玩了很久。

第二个是Strata(https://strata-descent.netlify.app/)，玩家在无尽的地下隧道里探索，目标是点亮尽可能多的灯笼。画面质感类似早年的《神秘岛》，说不上精致，但从无到有靠一句话生成出完整可玩的游戏，这个过程本身已经足够震撼。

Mollick甚至基于莱内·马利亚·里尔克的诗集《杜伊诺哀歌》，生成了同名游戏Duino(https://duino-elegies.netlify.app/)。玩家操控孤独的行者在夜景中行走，里尔克的诗句会随着行进逐行显示在屏幕上。玩法不算丰富，但氛围和动画设计反而最让人印象深刻。

除了游戏，Mollick还用Fable 5生成了一张等时交通图(https://isochronic-passage-chart.netlify.app/#nyc)，能可视化展示任意两点间的通勤时长，准确度和细节程度都相当可观。

这件事的信号很明确：过去需要一整个团队协作完成的项目，从游戏到工具，现在靠一句提示就能快速做出可用版本。对于靠创意快速试错的独立创作者来说，这是值得欢呼的进步。对于盯着AI能力曲线的创业者和从业者，这也是一个清晰的信号：行业的基础门槛，提升速度比很多人想的要快。

安全机制设计

Mythos级模型已经到了需要额外安全防护的门槛，Fable 5的核心风险来自网络安全和生物医药领域的两用性：同样的能力，合法防御者能用它发现修补漏洞，恶意用户也能用它发起攻击。

因此Anthropic给面向普通用户的Fable 5做了三层安全分类器：检测到网络安全、生物化学、模型蒸馏三类风险请求时，自动降级用Opus 4.8回复，不会让Fable 5直接输出。Anthropic数据显示，超过95%的用户会话不会触发任何降级，这些会话的使用体验和Mythos 5完全一致。

目前安全分类器做了保守设置，会误拦截部分无害请求，平均不到5%的会话会触发降级，Anthropic计划后续逐步优化减少误判。

安全分类器覆盖三个领域：

网络安全：拦截所有 offensive 网络任务相关请求，避免模型帮助恶意用户发现利用漏洞。外部红队测试和1000多小时的漏洞赏金测试，都没有发现能绕过分类器的通用越狱方法。

生物化学：目前拦截大部分相关请求自动降级。Anthropic测试发现，Mythos级模型仅靠通用生物推理能力，预测病毒外壳组装的准确性就超过了专门的蛋白质语言模型，这项能力可以用于基因疗法载体设计，也可能被滥用于改造危险病毒。后续Anthropic会开放受信访问计划，给合规生物医药研究人员放开Mythos 5的对应能力。