首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

OpenAI终于松口,突然宣布公开o3-mini的"思考过程"

腾讯科技《AI未来指北》特约作者 晓静

编辑 郑可君

北京时间2月7日,OpenAI宣布,ChatGPT的免费和付费用户将看到更新后的“思维链”,可以看到模型更多的“推理”步骤以及它是如何得出问题答案的。

根据OpenAI官方介绍:

o3-mini版本中,免费用户和付费用户都可使用

o3-mini-high版本中,仅付费用户可使用

OpenAI在X官方账号上表示,“我们正在为o3-mini引入一个更新后的‘思维链’,希望能让人们更容易理解模型的思考方式。”

OpenAI的一位发言人通过电子邮件告诉国外媒体TechCrunch:“通过这次更新,用户将能够跟随模型的推理过程,对模型的回应更加清晰和有信心。”

像o3-mini这样的推理模型有一个重要特征:它会在给出最终结果前进行全面的自我事实核查,这种机制能有效避免模型陷入常见的推理陷阱。不过这种严谨的思考过程也带来了时间成本,通常需要额外花费几秒到几分钟才能得出解决方案。

出于竞争考虑,OpenAI选择不公开其o3-mini及其前代产品o1和o1-mini的完整推理步骤。用户只能看到经过简化的推理过程摘要,而这些摘要有时会出现不准确的情况。

在同类产品中,中国大模型公司DeepSeek的R1采取了不同策略,选择完全公开其模型的思维过程,这种做法获得了众多AI研究人员的支持。

这种透明度不仅方便研究人员深入了解模型的运作机制,还能在实际应用中带来更好的用户体验,因为用户可以实时观察模型的推理方向是否正确。

今天,OpenAI仍然没有完全开放o3-mini的推理步骤,而是宣称用了一种更“平衡”的方式:允许o3-mini进行“自由思考”,然后将这些“思考过程”整理成摘要呈现给用户。

“为了确保输出的清晰性和安全性,我们在处理过程中增加了一个额外的后处理环节”,OpenAI发言人表示,“模型会先审查原始思维链,清除潜在的不安全内容,并对复杂概念进行简化处理。

更重要的是,这个后处理步骤能够让非英语用户以母语接收思维链的内容,从而提供更友好、更易理解的使用体验。”

OpenAI负责多智能体推理的研究员Noam Brown发布推文说:“在我们在o1-preview发布前向人们介绍‘草莓’,让他们实时看到思维链(Chain of Thought,CoT)的过程通常会成为一个‘顿悟’时刻,让他们明白这项技术将会产生重大影响。虽然现在展示的并不是原始的思维链,但这已经是向完全公开迈出的重要一步,我很高兴我们能够与全世界分享这种体验。”

OpenAI的首席产品官也表示,“我们正在努力让用户看到比现在更多的内容——特别是模型的思考过程,这个功能很快就会实现。至于是否展示全部内容,我们还在权衡中。虽然完全公开思维链可能会带来竞争对手模仿学习的风险,但我们也知道用户(尤其是专业用户)确实需要这些信息,因此我们会努力找到一个合适的平衡点。”

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OFWsKXcTP_dHVkxOOSB7vJdw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券