Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >刚刚!Open AI GPT-4.5 震撼发布:无须推理也能比肩o3-mini !

刚刚!Open AI GPT-4.5 震撼发布:无须推理也能比肩o3-mini !

作者头像
AgenticAI
发布于 2025-03-18 08:46:41
发布于 2025-03-18 08:46:41
1970
举报
文章被收录于专栏:AgenticAIAgenticAI

就在刚刚,GPT-4.5 研究预览版正式上线!作为Open AI迄今为止最大、最强的聊天模型,GPT-4.5 不仅交互更自然,还展现了“无须推理也能更强大”的惊艳能力,甚至在部分榜单上直接超越了 OpenAI 的 o3-mini。

“无须推理”也能这么强? GPT-4.5 的核心亮点在于:它通过更大规模的预训练和后训练,显著提升了无监督学习能力。这意味着,GPT-4.5 可以在不依赖复杂推理的情况下,快速识别模式、建立关联,并生成富有创意的洞察。这种“无须推理也能更强大”的特性,让它在多个领域展现了惊艳的表现。 来看看 GPT-4.5 在基准测试中的表现:

尤其值得一提的是,在 SWE-Lancer Diamond(编程)MMMLU(多语言)两项测试中,GPT-4.5 的表现直接超越了 OpenAI 的o3-mini!在编程任务 SWE-Lancer Diamond 上,GPT-4.5 拿下 32.6% 的成绩,而 o3-mini 仅为 10.8%,差距明显!在多语言能力 MMMLU 上,GPT-4.5 更是以 85.1% 的成绩领先 o3-mini 的 81.1%。

这意味着,GPT-4.5 在处理复杂编码和多语言任务时,已经展现出超越对手的硬核实力——而且这一切,还是在“无须推理”的模式下完成的!

分步上线,Pro 用户抢先体验 即日起,GPT-4.5 将向所有 ChatGPT Pro 用户推送。下周,Plus 和 Team 用户也将解锁体验;再下周,Enterprise 和 Edu 用户也能加入。不管你是个人用户还是企业团队,GPT-4.5 的强大实力都值得一试。

更自然、更贴心的交互体验 除了硬核性能,GPT-4.5 的交互体验也更上一层楼。早期测试显示,它不仅知识储备更广,还能更精准地理解用户意图,甚至在“情商”上都有了显著提升。无论是润色文章、写代码,还是解决实际问题,GPT-4.5 都能轻松胜任。

功能上,GPT-4.5 支持搜索最新信息、上传文件和图片,还能在 Canvas 模式下帮你修改文章或调试代码。目前,它还不支持 Voice Mode、视频或屏幕共享等功能,但未来他们会逐步完善这些体验。

彩蛋!

OpenAI在直播中回顾了自GPT-1到GPT4.5历代模型回答同一个问题,海水为何是咸的,正如我经常问的天空为何是蓝色的😂。

非常有趣,可以直观看到每代模型智能升级,我其实非常好奇GPT 2到GPT 3.5 Turbo这4年里发生了啥?

GPT-1(2018)

GPT-2(2019)

GPT-3.5 Turbo(2023)

GPT-4-Turbo(2023)

GPT-4.5(2025)

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-02-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AgenticAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
GPT-4.5登场!一个让Sam感到真实的AI,看到基准分数后,网友炸锅:2T参数都白训了?
好消息: 这是第一个让他感觉像在和一个真正会思考的人对话的模型。有几次他甚至惊讶于AI给出的建议竟然如此中肯。
AI进修生
2025/02/28
2300
GPT-4.5登场!一个让Sam感到真实的AI,看到基准分数后,网友炸锅:2T参数都白训了?
刚刚,GPT-4.5震撼上线情商逆天!OpenAI最大最贵模型最像人类,奥特曼带娃缺席
划重点:今天起,GPT-4.5会向所有ChatGPT Pro版用户开放,包括网页端、移动端和桌面端。另外所有付费开发者也能使用了。
新智元
2025/02/28
1130
刚刚,GPT-4.5震撼上线情商逆天!OpenAI最大最贵模型最像人类,奥特曼带娃缺席
满血版o1深夜震撼上线,奥特曼怼脸演示超强推理!终极Pro版每月1450元
这次,Sam Altman本人正式出镜,和研究科学家Hyung Won Chung、Max,以及思维链提出者Jason Wei一起,在短短15分钟内速速完成了发布。
新智元
2025/02/15
640
满血版o1深夜震撼上线,奥特曼怼脸演示超强推理!终极Pro版每月1450元
奥特曼率队深夜血战DeepSeek,o3-mini急上线!价格骨折免费用,ChatGPT被挤爆
刚刚,OpenAI官宣o3-mini和o3-mini-high两大版本正式在ChatGPT上线。
新智元
2025/02/04
1000
奥特曼率队深夜血战DeepSeek,o3-mini急上线!价格骨折免费用,ChatGPT被挤爆
o3-mini物理推理粉碎DeepSeek R1,OpenAI王者归来!全网最全实测来袭
DeepSeek R1用「降维打击」重构了AI界,OpenAI不甘示弱放出了o3-mini,再次加冕为王。
新智元
2025/02/04
1510
o3-mini物理推理粉碎DeepSeek R1,OpenAI王者归来!全网最全实测来袭
OpenAI首个免费推理模型o3-mini发布!奥特曼反思不开源的错误
DeepSeek为大模型领域带来了新的速度提升——就在昨天,OpenAI深夜紧急发布了其最新的推理模型:o3-mini系列,包含low、medium和high三个版本。
用户11203141
2025/03/06
770
OpenAI首个免费推理模型o3-mini发布!奥特曼反思不开源的错误
GPT-4o mini发布,OpenAI正式加入小模型竞争领域
而且原版的GPT-3.5已经不见了,官方称是为了能够让AI普及到更多普通人,所以推出了新的小模型GPT-4o mini。
算法一只狗
2024/07/20
2060
GPT-4o mini发布,OpenAI正式加入小模型竞争领域
GPT-4.5 Turbo意外曝光,官方网页被扒出,网传明天就上线
Claude 3 一经推出,AI 初创公司 Anthropic 被推上了大模型浪潮顶端。这一波压力立马给到了 OpenAI。不少网友调侃,GPT-5 呢?
机器之心
2024/03/18
1370
GPT-4.5 Turbo意外曝光,官方网页被扒出,网传明天就上线
o3-mini和DeepSeek-R1模型对比
o3-mini突然之间免费开放给普通用户,这次OpenAI宣布共有三个不同的版本:分别是o3-mini(low)、o3-mini(medium)和o3-mini
算法一只狗
2025/02/02
2.4K0
o3-mini和DeepSeek-R1模型对比
GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河
GPT-4.5令人失望的表现,再次印证了Ilya这句话的含金量:预训练已经达到极限,推理Scaling才是未来有希望的范式。
新智元
2025/03/03
460
GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河
OpenAI o3震撼觉醒,AGI今夜降临?血洗o1,破解陶哲轩最难数学题
奥特曼、Mark Chen、任泓宇和ARC Prize基金会主席Greg Kamradt为我们做了介绍
新智元
2025/02/15
580
OpenAI o3震撼觉醒,AGI今夜降临?血洗o1,破解陶哲轩最难数学题
OpenAI神秘搞事,GPT-4.5默默上线?推理碾压GPT-4网友震惊,奥特曼笑而不语
在LLM竞技场chat.lmsys.org上,这个神秘模型展现出了莫名强大的能力,甚至直接超越GPT-4,实在令人震惊。
新智元
2024/05/06
1790
OpenAI神秘搞事,GPT-4.5默默上线?推理碾压GPT-4网友震惊,奥特曼笑而不语
o3-mini 之后,大的要来了?!我不敢相信我们以前写代码真的会敲出每个字符!
还有完整版o3也快到来了, 此外Grok 3和Gemini 2.0 Pro等模型也在发布时间上线了:
AI进修生
2025/02/03
1430
o3-mini 之后,大的要来了?!我不敢相信我们以前写代码真的会敲出每个字符!
GPT-4.5 Turbo提前泄露?Altman亲自暗示新模型要来,传言本周四上线
就在今天,网友纷纷发现,一款号称是GPT-4.5 Turbo的模型,竟然同时出现在了Bing、谷歌、DuckDuck Go的搜索结果里!
新智元
2024/03/13
1490
GPT-4.5 Turbo提前泄露?Altman亲自暗示新模型要来,传言本周四上线
OpenAI新发布的o3-mini与DeepSeek R1全面对比
OpenAI 发布了最新的推理模型——o3-mini,它专为科学、数学、编程等领域优化,提供更快的响应、更高的准确度和更低的成本。与前代 o1-mini 相比,o3-mini 在推理能力上有了显著提升,尤其在复杂问题解决上,测试者偏爱 o3-mini 的答案达 56%,错误率减少了 39%。从今天起,ChatGPT Plus、Team和Pro用户可使用 o3-mini,免费用户也能体验其部分功能。
AgenticAI
2025/03/18
400
OpenAI新发布的o3-mini与DeepSeek R1全面对比
OpenAI 放大招:o3-mini 模型免费开放,API Key 获取流程简化!
2025年1月31日,OpenAI 再次震撼 AI 界,推出了全新的推理模型 o3-mini,并首次向免费用户开放 API!这一举措不仅让更多人有机会体验强大的 AI 技术,也彰显了 OpenAI 在激烈竞争中持续创新的决心。
攻坚克难的那份表
2025/02/11
1.5K0
GPT4o-mini发布,史上再无3.5
近日,OpenAI宣布推出其最新的人工智能模型——GPT-4o Mini。作为目前最具成本效益的小型模型,GPT-4o Mini旨在大幅拓展AI应用范围,同时降低开发成本。
扑扑特桔
2024/07/19
6621
GPT4o-mini发布,史上再无3.5
OpenAI 终于发布 GPT-4o mini,但比中国大模型晚了半年
美国时间 7 月18 日,OpenAI 正式发布了多模态小模型 GPT-4o mini,在海内外引起了广泛关注。
AI科技评论
2024/07/29
2370
OpenAI 终于发布 GPT-4o mini,但比中国大模型晚了半年
突发消息!OpenAI 今天发布 2 个新的推理模型:o3-mini 和 o3-mini-high。
普通用户也获得 o3-mini,plus用户能用上o3-mini (high),o3-mini (high) 在Codeforce上比o1高约200分,比o1更快、编码和数学表现更佳,成本却还是o1-mini的水平。
AI进修生
2025/02/03
6310
突发消息!OpenAI 今天发布 2 个新的推理模型:o3-mini 和 o3-mini-high。
Open AI发布GPT-4o,开启新的人机交互革命
—、Open AI此次一系列的应用能力展示、API降价、GPT免费,足以说明了Open AI希望推动AI全民应用的决心 来源 / ToB行业头条 (ID:wwwqifu) 作者 / 樊航
ToB行业头条
2024/11/30
1930
Open AI发布GPT-4o,开启新的人机交互革命
推荐阅读
GPT-4.5登场!一个让Sam感到真实的AI,看到基准分数后,网友炸锅:2T参数都白训了?
2300
刚刚,GPT-4.5震撼上线情商逆天!OpenAI最大最贵模型最像人类,奥特曼带娃缺席
1130
满血版o1深夜震撼上线,奥特曼怼脸演示超强推理!终极Pro版每月1450元
640
奥特曼率队深夜血战DeepSeek,o3-mini急上线!价格骨折免费用,ChatGPT被挤爆
1000
o3-mini物理推理粉碎DeepSeek R1,OpenAI王者归来!全网最全实测来袭
1510
OpenAI首个免费推理模型o3-mini发布!奥特曼反思不开源的错误
770
GPT-4o mini发布,OpenAI正式加入小模型竞争领域
2060
GPT-4.5 Turbo意外曝光,官方网页被扒出,网传明天就上线
1370
o3-mini和DeepSeek-R1模型对比
2.4K0
GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河
460
OpenAI o3震撼觉醒,AGI今夜降临?血洗o1,破解陶哲轩最难数学题
580
OpenAI神秘搞事,GPT-4.5默默上线?推理碾压GPT-4网友震惊,奥特曼笑而不语
1790
o3-mini 之后,大的要来了?!我不敢相信我们以前写代码真的会敲出每个字符!
1430
GPT-4.5 Turbo提前泄露?Altman亲自暗示新模型要来,传言本周四上线
1490
OpenAI新发布的o3-mini与DeepSeek R1全面对比
400
OpenAI 放大招:o3-mini 模型免费开放,API Key 获取流程简化!
1.5K0
GPT4o-mini发布,史上再无3.5
6621
OpenAI 终于发布 GPT-4o mini,但比中国大模型晚了半年
2370
突发消息!OpenAI 今天发布 2 个新的推理模型:o3-mini 和 o3-mini-high。
6310
Open AI发布GPT-4o,开启新的人机交互革命
1930
相关推荐
GPT-4.5登场!一个让Sam感到真实的AI,看到基准分数后,网友炸锅:2T参数都白训了?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文