就在刚刚,GPT-4.5 研究预览版正式上线!作为Open AI迄今为止最大、最强的聊天模型,GPT-4.5 不仅交互更自然,还展现了“无须推理也能更强大”的惊艳能力,甚至在部分榜单上直接超越了 OpenAI 的 o3-mini。
“无须推理”也能这么强? GPT-4.5 的核心亮点在于:它通过更大规模的预训练和后训练,显著提升了无监督学习能力。这意味着,GPT-4.5 可以在不依赖复杂推理的情况下,快速识别模式、建立关联,并生成富有创意的洞察。这种“无须推理也能更强大”的特性,让它在多个领域展现了惊艳的表现。 来看看 GPT-4.5 在基准测试中的表现:
尤其值得一提的是,在 SWE-Lancer Diamond(编程)和 MMMLU(多语言)两项测试中,GPT-4.5 的表现直接超越了 OpenAI 的o3-mini!在编程任务 SWE-Lancer Diamond 上,GPT-4.5 拿下 32.6% 的成绩,而 o3-mini 仅为 10.8%,差距明显!在多语言能力 MMMLU 上,GPT-4.5 更是以 85.1% 的成绩领先 o3-mini 的 81.1%。
这意味着,GPT-4.5 在处理复杂编码和多语言任务时,已经展现出超越对手的硬核实力——而且这一切,还是在“无须推理”的模式下完成的!
分步上线,Pro 用户抢先体验 即日起,GPT-4.5 将向所有 ChatGPT Pro 用户推送。下周,Plus 和 Team 用户也将解锁体验;再下周,Enterprise 和 Edu 用户也能加入。不管你是个人用户还是企业团队,GPT-4.5 的强大实力都值得一试。
更自然、更贴心的交互体验 除了硬核性能,GPT-4.5 的交互体验也更上一层楼。早期测试显示,它不仅知识储备更广,还能更精准地理解用户意图,甚至在“情商”上都有了显著提升。无论是润色文章、写代码,还是解决实际问题,GPT-4.5 都能轻松胜任。
功能上,GPT-4.5 支持搜索最新信息、上传文件和图片,还能在 Canvas 模式下帮你修改文章或调试代码。目前,它还不支持 Voice Mode、视频或屏幕共享等功能,但未来他们会逐步完善这些体验。
彩蛋!
OpenAI在直播中回顾了自GPT-1到GPT4.5历代模型回答同一个问题,海水为何是咸的,正如我经常问的天空为何是蓝色的😂。
非常有趣,可以直观看到每代模型智能升级,我其实非常好奇GPT 2到GPT 3.5 Turbo这4年里发生了啥?
GPT-1(2018)
GPT-2(2019)
GPT-3.5 Turbo(2023)
GPT-4-Turbo(2023)
GPT-4.5(2025)
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有