首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >重磅!OpenAI 发布开源模型:GPT-OSS,效果媲美 o4-mini

重磅!OpenAI 发布开源模型:GPT-OSS,效果媲美 o4-mini

作者头像
程序猿DD
发布2025-08-06 18:44:38
发布2025-08-06 18:44:38
2.1K0
举报
文章被收录于专栏:程序猿DD程序猿DD

开源大模型已经很多没有重磅消息了,没想到睡前看到一直被戏称为CloseAI的OpenAI居然发布了开源大模型:GPT-OSS

模型概述

根据 OpenAI 的官方公告,GPT-OSS 系列包括两个变体:

  • • GPT-OSS-120B:约 120 亿参数,设计用于高推理需求的生产环境,性能接近 OpenAI 的 o4-mini 模型,可在单块 80GB GPU 上高效运行。
  • • GPT-OSS-20B:约 20 亿参数,优化为低延迟,适合在 16GB 内存的消费级硬件上运行,性能与 o3-mini 相当,适合本地推理或快速迭代。(这就非常棒了,一张16G显存的消费级显卡还是很容易获得的

这些模型采用混合专家(Mixture-of-Experts)架构,并使用 4 位量化方案(MXFP4),在保持资源使用低的同时实现快速推理。

根据评测数据,GPT-OSS 模型在推理任务上表现出色,特别是在链式推理(Chain-of-Thought)和工具使用方面。例如,GPT-OSS-120B 在核心推理基准测试中接近 o4-mini 的表现,而 GPT-OSS-20B 则适合边缘设备,适用于本地部署或快速原型开发。模型支持可配置的推理努力级别(低、中、高),允许用户根据具体需求和延迟要求进行调整。

此外,该开源模型的另一大亮点是采用了宽松的Apache 2.0许可证,允许广泛的修改和商业用途,无需担心专利风险。

不过这次OpenAI开源的大模型,在评测方面只给出了与自己模型的比较,并没有给出与其他厂商模型的评分对比。但用户可根据其自家模型水平来评估起能力,比如:

  • • GPT-OSS-120B 接近 o4-mini
  • • GPT-OSS-20B 接近 o3-mini

用户可根据o4-mini、o3-mini与其他厂商模型的能力对比来评估GPT-OSS-120B与GPT-OSS-20B。

参考资料

  • • https://openai.com/index/introducing-gpt-oss/
  • • https://huggingface.co/openai/gpt-oss-120b
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-08-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 程序猿DD 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 模型概述
  • 参考资料
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档