刚刚,Anthropic正式发布了新一代Claude模型Fable 5和Mythos 5,这是Anthropic首个面向普通用户开放的Mythos级模型,能力超过所有此前公开的Claude版本。

Mythos级是Anthropic定义的、能力高于Opus系列的新模型层级,Fable 5和Mythos 5底层是同一个模型,仅通过安全机制做权限区分:Fable 5面向普通用户开放,内置安全防护机制,对部分高风险主题请求自动降级到次顶级模型Opus 4.8处理;Mythos 5开放全部能力,目前仅面向经审核的网络安全防御机构和生物医药研究人员,通过受信访问计划开放。
目前Fable 5已经对所有用户开放,定价为每百万输入token 10美元,每百万输出token 50美元,不到此前Mythos Preview定价的一半。
以下是Fable 5和其他头部模型的 benchmark对比:

测试阶段,Stripe团队测试Fable 5时,用它在5000万行的Ruby代码库中完成全库迁移,原本一个团队需要两个多月的手工工作,Fable 5只用了一天。
在Cognition的FrontierCode代码质量测试中,Fable 5拿到了前沿模型中的最高分,token效率也比过往Claude模型更高。


GitHub、Cursor、Cognition等工具团队的早期测试反馈,Fable 5能完成此前模型做不到的长周期复杂编码任务,自主性和可靠性都有明显提升。
在Hebbia面向资深金融推理的测试基准中,Fable 5拿到了所有模型中的最高分,在文档推理、图表解读、问题解决环节提升明显。交易公司IMC测试显示,Fable 5几乎在所有交易分析评估中都拿到了高分,覆盖事实查询、概念推理、根因分析和期望价值分析等环节。
Fable 5是当前视觉任务的最优模型,能从精细的科学图表中提取精确数字,仅靠截图就能重构出网页应用的完整源码。
过往Claude模型即使搭配额外辅助工具也很难通关《宝可梦 火红》,Fable 5仅靠原始游戏截图,不需要任何地图导航或额外游戏状态信息,就能完整通关。
Fable 5能在数百万token的长任务中保持聚焦,还能利用自身笔记优化输出。在《杀戮尖塔》测试中,给模型开放持久化文件记忆后,Fable 5的性能提升幅度是Opus 4.8的三倍,到达最终关卡的次数也是三倍。
以下几个示例能直观体现Fable 5的自主能力:
Mythos 5版本已经被用于内部药物研发流程,蛋白质设计专家测试显示,模型能自主完成科学家的全部常规工作:选择结合位点、调用工具、从失败中恢复,部分环节的研发速度提升了十倍,产出质量不输给熟练的人类研究员。14个测试蛋白靶点中,有9个产出了符合药物研发要求的候选蛋白,目前已经进入后续研究阶段。

Mythos 5还是Anthropic第一个能稳定产出新颖、可信科学假设的模型。内部双盲测试中,科学家有80%的概率更偏好Mythos 5产出的分子生物学假设,部分假设已经进入实验验证。已经有一个关于大肠杆菌蛋白的新颖机制假设,被独立研究团队的预印本研究证实。
宾夕法尼亚大学AI研究者Ethan Mollick第一时间做了实测,结果超出不少人的预期,各位可以直接点开体验。
他在自己的Substack博客提到,Fable 5的表现大幅领先他用过的所有其他公开模型。它能连续12小时按照多页的需求文档执行任务,在各类问题上都表现稳定,还出过不少让人惊讶的结果。
最有代表性的测试,是用Fable 5生成视频游戏——所有游戏,都是在Claude Code里只输入了一个初始提示生成的。
第一个是经典的贪吃蛇Snake(https://snake-stable-build.netlify.app/),操作逻辑和80年代街机完全一致:控制一条不断移动的蛇吃苹果,跑出屏幕就死亡。看起来简单,但玩起来意外上头,TechCrunch的作者也承认自己摸鱼玩了很久。

第二个是Strata(https://strata-descent.netlify.app/),玩家在无尽的地下隧道里探索,目标是点亮尽可能多的灯笼。画面质感类似早年的《神秘岛》,说不上精致,但从无到有靠一句话生成出完整可玩的游戏,这个过程本身已经足够震撼。

Mollick甚至基于莱内·马利亚·里尔克的诗集《杜伊诺哀歌》,生成了同名游戏Duino(https://duino-elegies.netlify.app/)。玩家操控孤独的行者在夜景中行走,里尔克的诗句会随着行进逐行显示在屏幕上。玩法不算丰富,但氛围和动画设计反而最让人印象深刻。

除了游戏,Mollick还用Fable 5生成了一张等时交通图(https://isochronic-passage-chart.netlify.app/#nyc),能可视化展示任意两点间的通勤时长,准确度和细节程度都相当可观。

这件事的信号很明确:过去需要一整个团队协作完成的项目,从游戏到工具,现在靠一句提示就能快速做出可用版本。对于靠创意快速试错的独立创作者来说,这是值得欢呼的进步。对于盯着AI能力曲线的创业者和从业者,这也是一个清晰的信号:行业的基础门槛,提升速度比很多人想的要快。
Mythos级模型已经到了需要额外安全防护的门槛,Fable 5的核心风险来自网络安全和生物医药领域的两用性:同样的能力,合法防御者能用它发现修补漏洞,恶意用户也能用它发起攻击。
因此Anthropic给面向普通用户的Fable 5做了三层安全分类器:检测到网络安全、生物化学、模型蒸馏三类风险请求时,自动降级用Opus 4.8回复,不会让Fable 5直接输出。Anthropic数据显示,超过95%的用户会话不会触发任何降级,这些会话的使用体验和Mythos 5完全一致。
目前安全分类器做了保守设置,会误拦截部分无害请求,平均不到5%的会话会触发降级,Anthropic计划后续逐步优化减少误判。
安全分类器覆盖三个领域:



除此之外,Anthropic对Fable 5和Mythos 5的商业客户数据强制要求30天留存,仅用于安全审计检测攻击和优化误判,不会用于训练新模型,30天后会几乎全部删除。
模型对齐测试显示,Fable 5和Mythos 5的错误行为概率和Opus 4.8处于同一水平,详细测试数据可以查看[官方系统卡](https://anthropic.com/claude-fable-5-mythos-5-system-card)。

Claude Fable 5今天已经对所有用户开放,Mythos 5目前仅对Project Glasswing的网络安全合作方开放,后续会逐步开放给经审核的生物医药研究人员,未来再扩大受信访问计划的覆盖范围。
订阅制用户的访问分阶段开放:
所有API用户目前都可以正常调用claude-fable-5模型。