前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >突发消息!OpenAI 今天发布 2 个新的推理模型:o3-mini 和 o3-mini-high。

突发消息!OpenAI 今天发布 2 个新的推理模型:o3-mini 和 o3-mini-high。

作者头像
AI进修生
发布2025-02-03 21:44:14
发布2025-02-03 21:44:14
6310
举报
文章被收录于专栏:AI进修生AI进修生

o3-mini和o3-mini (high) 今天要发布了。

普通用户也获得 o3-mini,plus用户能用上o3-mini (high),o3-mini (high) 在Codeforce上比o1高约200分,比o1更快、编码和数学表现更佳,成本却还是o1-mini的水平。

plus用户 o3-mini每天能用100次。不过o3-mini (high)的使用次数限制还需要进一步确认。

有网友说,是的,R1这么火,Openai 按不住了:

而且前面Qwen团队除夕发qwen2.5-max,春节,大家还是要卷,哈哈哈。。。

其实早在圣诞节直播时,Openai就宣布了o3 mini将在2025年年初提供:

我们还是要说一下什么是 o3 和 o3-mini?

o3:一种在编码、数学甚至面向 AGI 基准测试中表现出色的尖端推理模型。它为智能和问题解决设定了新的基准。

o3-mini:o3 的性价比版本,以极低的成本和速度提供卓越的性能。

这些模型将推理提升到了全新的水平,使复杂任务中的突破成为可能,这些任务需要深入理解和逻辑。

o3来带来三个重大突破。

编程能力:实际编程准确率71.7%,超过o1整整20%。在Codeforces上达到2727分,已经超越人类水平。

数学水平:美国数学奥赛预选赛准确率近97%。就连最难的Epic AI前沿数学题,也能拿到25%的成绩。

最惊人的是Arc AGI测试:87.5%的成绩,首次在这个难度极高的基准测试上超越人类。

为什么 o3-mini 是颠覆性的创新,o3-mini带来两个改变。

自适应思考:可以根据任务难度调整推理深度,选择低、中、高三种模式。让AI更贴近实际使用场景。

性价比突破:比o1-mini成本低,响应更快,效果更好。

不过,网友感叹o3 high每项任务消耗1000美元:

此外,确实现在的模型太多了,具体如何切换模型,我们还有待确认:

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-01-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI进修生 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档