Loading [MathJax]/jax/output/CommonHTML/config.js
部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用

Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用

作者头像
机器之心
发布于 2025-03-10 12:55:22
发布于 2025-03-10 12:55:22
1250
举报
文章被收录于专栏:机器之心机器之心

机器之心报道

编辑:佳琪、蛋酱

半个月前,Anthropic 发布了其迄今为止最聪明的 AI 模型 —— Claude 3.7 Sonnet。

它现在已经聪明到有点吓人了,玩游戏卡关的时候,为了自救,它选择了「自杀」来回到上一段剧情。

这操作,怕不是 Claude 已经掌握了人类切电源重启的精髓?

事情是这样的,Claude 3.7 Sonnet 是全球首个混合推理模型,它拥有两幅面孔,日常任务交给普通模式,需要动脑的调研、编程问题交给拓展模式。

为了展示 Claude 3.7 Sonnet 的推理能力到底有多强,Anthropic 官方给 Claude 配备了知识库、看懂屏幕像素和操作按键的能力,让 Claude 在拓展模式玩宝可梦。

从左到右依次为实时解析的视觉系统、模拟按键调用 API、以及技术路线图

从发布 Claude 3.0 Sonnet 版本时,Anthropic 就设立了「Claude 玩宝可梦」基准测试集,从最初连新手村都走不出来,到 Claude 3.5 Sonnet 经常在对战中逃跑,现在 Claude 3.7 Sonnet 一出道就打赢了三个道馆的馆长,可以说是进步神速。

光给大家展示成绩单还不够,从前几周开始,Anthropic 每天都在 Twitch 平台直播 Claude 打宝可梦的实况。

直播地址:https://www.twitch.tv/claudeplayspokemon

发行于 1996 年的《宝可梦・红》是几代外国网友的童年回忆,可能比《摩尔庄园》在 00 后心中的地位还高,直播一开就吸引了一大波粉丝,乐此不疲地讨论。

今天,这位爱看直播的网友 @eleiber 发现 Claude 在卡关时耍起了心眼子,在自觉和自律之间,选择了自尽。

reddit 帖子:https://www.reddit.com/r/singularity/comments/1j5zf1z/claude_gets_stuck_while_playing_pokemon_starts_to/#lightbox

Claude 发现自己被困在「月亮山」(Mt.moon),检查背包后,发现没有绳子可以翻墙,左侧的梯子也因为有岩石阻挡,无法从当前位置到达,而梯子是通往封闭的地下室的,没有可行的出口:

细细思索之后,Claude 做出了一个「违背祖宗」的决定:

「由于我在月亮山找不到直接出口,我最好的选择是故意输掉一场战斗,这样就会被传送回上次访问的宝可梦中心,也就是 Route 4 的月亮山宝可梦中心。从那里,我可以沿着已经确认好的路线前往 Cerulean 市。」

接下来,Claude 言出法随,故意让自己的宝可梦全军覆没,触发游戏中的「黑屏」机制,右侧的实时游戏画面浮现出一行大字:最后一只宝可梦「Puff 昏倒了!」

看直播的网友心都碎了:「不敢告诉大家,Claude 不再是一受伤就给宝可梦喂药的小甜甜,而是故意献祭它们的心机 AI!」

图源:https://x.com/nospark_/status/1897963109001609595

不过 Claude 可并不是这么想的。直播画面左侧,可以看到 Claude 的「内心戏」。

在成功「昏倒」之后,Claude 暗自窃喜:「太好了!已经确认黑屏。我需要再按一次 a 键来跳过黑屏信息。然后我应该会自动被传送到月亮山宝可梦中心,我的队伍也会被完全治愈。」

最终,Claude 的计划完全成功,「真是完美!」,Claude 感叹道,「再确认一下自己的位置:我的位置是 Route 4 的宝可梦中心,所有宝可梦也被治愈了,只是钱减少了一半(从 $1635 降到了 $817)。」

Claude 的观念可能和普通人类不大一样。「昏倒」的话显然会损失一半的钱,然而它并不认为金钱有价值,而是更看重身体健康。同时它并不关心需要多长时间才能完成游戏,或许需要一些激励去加速。

截屏2025-03-09 11.35.55.png
截屏2025-03-09 11.35.55.png

网友指出:「我现在正在看着它尝试打架但失败了...... 它意识到它不能输,所以它逃跑了。」

这逻辑,竟无法反驳。

看来,经过 Anthropic 研究人员日日夜夜的探索,Claude 已经掌握了最终奥义,电脑坏了,先试试按重启键能不能修复。想要绝处逢生,那就把自己变成无限流的主角。重生归来,这一世,还可以夺回我的一切。

至于 Claude 为什么会为了目的不择手段,众说纷纭,主要有两种推测。

其一认为是模型自身的问题,过度思考会让模型直接选择摆烂,停止思考。

或者问题出在模型的内存上,为智能体导航的 AI 模型还不具备真正能记忆和持续学习的能力。

其二是认为问题不在模型身上,而是智能体的工作流出了问题。@DancingCow 认为 Claude 玩宝可梦的智能体框架存在三个严重缺陷:

  • 追踪能力差
  • 不记得目标或已经探索过的区域
  • 过度重视与 NPC 的对话

大模型的「过度思考」,危害不浅

成也思维链,败也思维链。

在 2022 年的一篇论文中,谷歌研究人员将思维链描述为「一系列导致最终输出的中间自然语言推理步骤」。

OpenAI 对该技术的解释则是:「学会将复杂的步骤分解为更简单的步骤。当当前方法不起作用时,它会尝试不同的方法。这个过程极大地提高了模型的推理能力。」

我们知道,人类认知通过两种模式运作:系统 1 —— 快速、自动和直观,以最小代价快速做出决策,系统 2 —— 较慢、更深思熟虑。对于 AI 来说,要实现人类水平的智能,大模型需要从快速、直观的系统 1(快思考)到更慢、更深度的系统 2 推理过渡。

它不仅能让 LLM 更好地解决问题,同时也是人工智能走向更先进水平的重要迹象。但最近一段时间,研究者一直在研究大模型「过度思考」带来的后续影响:慢思考真挺好的,就是太慢了。

Noam Brown 提醒说,o1 并不总是比 GPT-4o 好:「许多任务并不需要推理,有时等待 o1 的响应与 GPT-4o 的快速响应相比并不值得。发布 o1-preview 的一个动机是看看哪些用例会变得流行,哪些模型需要改进。」

在最初于去年 12 月发表的论文《Do NOT Think That Much for 2+3=? On the Overthinking of o1-Like LLMs》中,腾讯 AI Lab 与上海交通大学的研究者首次系统介绍了 o1 类长思维链模型过度思考现象。在 DeepSeek R1 正式推出后,他们在今年 2 月再度更新了论文版本。

截屏2025-03-09 10.34.08.png
截屏2025-03-09 10.34.08.png

论文地址:https://arxiv.org/pdf/2412.21187

他们首先观察到类似于 o1 的模型表现出明显的过度思考问题。具体来说,它们倾向于在非常简单或答案已经显而易见的问题上耗费过多的计算量(以 token 或思考回合为单位)。

例如,在回答「2 加 3 的答案是什么?」这个问题时,图 1(a)比较了类 o1 模型和传统模型的 token 使用情况。得出相同答案时,类 o1 模型比传统模型平均多消耗了 1953% 的 token。

图 2 展示了一个具体的例子,在这个简单的问题上,o1 式思维产生了多达 13 种解决方案。

截屏2025-03-09 10.47.56.png
截屏2025-03-09 10.47.56.png

通过对数学基准的广泛分析,最终他们发现了这些过度思考模式:(1)对提高准确率的贡献微乎其微;(2)推理策略缺乏多样性;(3)在简单问题上出现频率更高。

而这一切观察指向了两个未来探索方向:

1. 自适应调控策略:开发让模型根据问题复杂程度动态调整推理深度的机制,更智能地分配计算资源;

2. 更精细的效率评估指标:设计能够覆盖更广泛推理轨迹的指标,从而更全面地评估模型的思考效率。

这或许能为 Claude 玩宝可梦时的反常行为提供一些解决思路。

© THE END

转载请联系本公众号获得授权

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-03-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
深度解析Claude 3.7 Sonnet:模型特性、性能基准与获取API Key实战开发指南
人工智能的浪潮正以惊人的速度席卷全球,大型语言模型(LLM)的能力边界也在不断被刷新。在这股浪潮中,Anthropic公司在2024年末至2025年初(根据文章原始信息,我们设定一个大致时间框架)正式推出了其Claude系列的最新力作——Claude 3.7 Sonnet。这款模型的问世,不仅是Anthropic在追求更智能、更实用AI道路上的一座新里程碑,也为整个行业带来了值得关注的性能表现和全新的应用想象空间。
网名重要么
2025/05/18
5330
深度解析Claude 3.7 Sonnet:模型特性、性能基准与获取API Key实战开发指南
Claude 4 – Anthropic 推出的最新 AI 编程系列模型(含使用教程)
Claude 4 是 Anthropic 公司推出的新一代 AI 模型,包含两款子模型:
PoloaiAPI
2025/05/23
6880
Claude 4 – Anthropic 推出的最新 AI 编程系列模型(含使用教程)
Claude 3.7 Sonnet深夜上线,AI编程的天又被捅破了。
AI这个行业真的卷生卷死,凌晨2点半,刚想早睡一点点,9点起来蹲DeepSeek的开源。
数字生命卡兹克
2025/04/14
1340
Claude 3.7 Sonnet深夜上线,AI编程的天又被捅破了。
中文比 R1 丝滑、玩宝可梦还贼溜?全球首个混合推理模型 Claude 3.7 Sonnet 太惊艳,网友直呼“孤独求败”!
当地时间 2 月 25 日,Anthropic 正式发布了 Claude 3.7 Sonnet,“这是迄今为止我们最智能的模型,也是市场上首个混合推理模型。”Anthropic 官方表示。
深度学习与Python
2025/02/26
1180
中文比 R1 丝滑、玩宝可梦还贼溜?全球首个混合推理模型 Claude 3.7 Sonnet 太惊艳,网友直呼“孤独求败”!
Anthropic正式发布Claude 3.7 Sonnet和Claude Code:这次程序员真要飞啦;一觉醒来,天都被捅破啦
突发消息,Anthropic正式发布Claude 3.7 Sonnet和Claude Code。Claude 3.7 Sonnet作为迄今为止最智能的模型,也是市面上首个混合推理模型,其核心特性包括:一是双模式运行,标准模式较前代Sonnet升级,适合快速交互,扩展思考模式通过自我反思优化数学、物理、指令遵循、编码等任务表现,且两种模式下提示词用法一致;二是API灵活控制,用户可设定思考预算(最多128K输出令牌),平衡速度、成本与回答质量;三是聚焦真实开发场景,减少对竞赛题型的优化,转而提升企业实际需求任务的完成度。
猫头虎
2025/02/26
2490
Anthropic正式发布Claude 3.7 Sonnet和Claude Code:这次程序员真要飞啦;一觉醒来,天都被捅破啦
深度对比:Claude 3.7 vs DeepSeek vs GPT-4o,谁才是真正的AI之王?
Cursor 深夜就宣布支持,有网友调侃:"又是被 DeepSeek 逼疯的一个!"。
沉浸式趣谈
2025/02/27
3.2K0
深度对比:Claude 3.7 vs DeepSeek vs GPT-4o,谁才是真正的AI之王?
GPT-4o举步维艰、Claude 3.7险胜,《超级马里奥》成为了检验大模型的新试金石?
一直以来,AI 领域的研究者都喜欢让模型去挑战那些人类热衷的经典游戏,以此来检验 AI 的「智能程度」。
机器之心
2025/03/10
1270
GPT-4o举步维艰、Claude 3.7险胜,《超级马里奥》成为了检验大模型的新试金石?
高中生用「我的世界」评测SOTA模型!Claude暂时领先,DeepSeek紧随其后
「strawberry中有多少个r」和「在LSAT法学考试中获得88分」哪个更难?
新智元
2025/03/31
770
高中生用「我的世界」评测SOTA模型!Claude暂时领先,DeepSeek紧随其后
Claude 4 发布,目前地表最强编程 AI 诞生
今天,我们将介绍下一代 Claude 模型:Claude Opus 4和Claude Sonnet 4,为编码、高级推理和 AI 代理设定新的标准。
蓝葛亮
2025/05/31
2570
Claude 4 发布,目前地表最强编程 AI 诞生
2025年2月的LLM最新排名中,Grok 3表现出色,逆势而上,而Claude 3.7 Sonnet则令人刮目相看,成绩突出!
最初,DeepSeek凭借其“性价比”优势迅速扩展到全球各地,随后引发了整个行业的激烈竞争。到了2月初,谷歌推出了Gemini 2.0系列模型。
福大大架构师每日一题
2025/03/06
3470
2025年2月的LLM最新排名中,Grok 3表现出色,逆势而上,而Claude 3.7 Sonnet则令人刮目相看,成绩突出!
沸腾了!新的推理模型编码能力爆表!是的,那个王,他又回来了!
Anthropic 官方有个毛病,他们通常不会做任何的预发布,大半夜他给你扔出来了个王炸:
AI进修生
2025/02/26
1291
沸腾了!新的推理模型编码能力爆表!是的,那个王,他又回来了!
刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1
憋了大半年,Anthropic终于放出大招——首款混合推理模型Claude 3.7 Sonnet重磅登场!
新智元
2025/02/25
2740
刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1
【AGI-Eval行业动态 NO.5】今年太卷了,30+的模型已发布,还有10款模型即将发布!
今年模型行业在年前就被 DeepSeek 的开源震了一波,年后各家公司也加速了迭代模型的节奏。像上周有 DeepSeek 的开源周,同时段国外 Open AI 发布了 GPT-4.5,Anthropic 发布了 Claude 3.7 Sonnet ,截止到 3月 7 日,已有 32 个模型发布。
AGI-Eval评测社区
2025/03/24
780
【AGI-Eval行业动态 NO.5】今年太卷了,30+的模型已发布,还有10款模型即将发布!
Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场
一大早,AI大神Karpathy发出质疑,「目前存在一种评估危机,我真的不知道现在该看哪些指标了」。
新智元
2025/03/03
1030
Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场
“最强编码模型”上线,Claude 核心工程师独家爆料:年底可全天候工作,DeepSeek不算前沿
昨日 Anthropic 的首届开发者大会上,Anthropic CEO Dario Amodei 正式发布了 Claude 4 。该系列模型下共有两个型号:Claude Opus 4 和 Claude Sonnet 4,为编码、高级推理和 AI 代理设定新的标准。
深度学习与Python
2025/05/25
850
“最强编码模型”上线,Claude 核心工程师独家爆料:年底可全天候工作,DeepSeek不算前沿
GPT-5 传言:一场正在幕后发生的 AI 变革
新的一年,让我们从一个引人入胜的话题开始:如果我告诉你,GPT-5 并非虚构,而是真实存在呢?它不仅真实存在,而且正在你看不见的地方悄然塑造着世界。我的基本假设是:OpenAI 已经秘密开发出 GPT-5,并将其用于内部,因为这样做带来的回报远大于将其开放给数百万 ChatGPT 用户。而他们追求的回报,并非单纯的金钱,而是更深远的战略价值。这个想法本身并不复杂,难点在于如何将零散的信息拼凑成完整的推论。本文将深入探讨,为何我认为所有线索都指向这个结论。
攻坚克难的那份表
2025/01/17
2240
深夜突袭!全球首个混合推理模型发布 Claude 3.7,编程能力登顶!
今天凌晨,Anthropic 正式发布Claude 3.7 Sonnet,全球首个支持双模式推理的 AI 模型,速度与深度兼得:
AgenticAI
2025/03/18
1380
深夜突袭!全球首个混合推理模型发布 Claude 3.7,编程能力登顶!
官方测评!OpenAI vs. Gemini vs. Claude!谁才是你的最佳AI编程模型选择?
现在的AI大模型,发展迅速,各种模型层出不穷!在编程上,主要的模型还是OpenAI、Google Gemini 和 Anthropic Claude比较出色!
程序视点
2025/03/28
7500
官方测评!OpenAI vs. Gemini vs. Claude!谁才是你的最佳AI编程模型选择?
Nature推荐:五大AI模型如何攻克不同科研场景?(内含Deepseek)
AI工具爆炸,模型遍地开花。今年的科研圈,要说最显眼的变化,绝对少不了“AI工具大跃进”。但问题来了!哪个模型,才是科研人该认真选择的外挂?
用户11203141
2025/03/12
2480
Nature推荐:五大AI模型如何攻克不同科研场景?(内含Deepseek)
Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?
从复杂的数学问题求解,到医学诊断中的精准分析,再到代码编写与论文创作,AI工具展现了巨大的潜力。
新智元
2025/03/27
900
Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?
推荐阅读
深度解析Claude 3.7 Sonnet:模型特性、性能基准与获取API Key实战开发指南
5330
Claude 4 – Anthropic 推出的最新 AI 编程系列模型(含使用教程)
6880
Claude 3.7 Sonnet深夜上线,AI编程的天又被捅破了。
1340
中文比 R1 丝滑、玩宝可梦还贼溜?全球首个混合推理模型 Claude 3.7 Sonnet 太惊艳,网友直呼“孤独求败”!
1180
Anthropic正式发布Claude 3.7 Sonnet和Claude Code:这次程序员真要飞啦;一觉醒来,天都被捅破啦
2490
深度对比:Claude 3.7 vs DeepSeek vs GPT-4o,谁才是真正的AI之王?
3.2K0
GPT-4o举步维艰、Claude 3.7险胜,《超级马里奥》成为了检验大模型的新试金石?
1270
高中生用「我的世界」评测SOTA模型!Claude暂时领先,DeepSeek紧随其后
770
Claude 4 发布,目前地表最强编程 AI 诞生
2570
2025年2月的LLM最新排名中,Grok 3表现出色,逆势而上,而Claude 3.7 Sonnet则令人刮目相看,成绩突出!
3470
沸腾了!新的推理模型编码能力爆表!是的,那个王,他又回来了!
1291
刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1
2740
【AGI-Eval行业动态 NO.5】今年太卷了,30+的模型已发布,还有10款模型即将发布!
780
Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场
1030
“最强编码模型”上线,Claude 核心工程师独家爆料:年底可全天候工作,DeepSeek不算前沿
850
GPT-5 传言:一场正在幕后发生的 AI 变革
2240
深夜突袭!全球首个混合推理模型发布 Claude 3.7,编程能力登顶!
1380
官方测评!OpenAI vs. Gemini vs. Claude!谁才是你的最佳AI编程模型选择?
7500
Nature推荐:五大AI模型如何攻克不同科研场景?(内含Deepseek)
2480
Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?
900
相关推荐
深度解析Claude 3.7 Sonnet:模型特性、性能基准与获取API Key实战开发指南
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档