这周 OpenAI 打了一套密集到离谱的组合拳——4天4个重磅发布
模型、应用、桌面端、企业工具全面铺开,看得人目不暇接
3月3日上线,替代 GPT-5.2 Instant 成为 ChatGPT 的默认日常模型。
这次改了什么?一句话:说人话了。
之前的 GPT-5.2 Instant 有个毛病——动不动就来一句"让我们停下来,深呼吸",或者在你问个正常问题时给你贴一堆免责声明。用户吐槽这叫"cringe"(尬),OpenAI 这次直接把这个当核心问题来修。
关键数据:
3月4日,Codex 桌面应用正式上线 Windows
之前只有 macOS 版,上线第一周下载量就破了100万,目前周活160万
50万人排队等 Windows 版,这次终于来了。
核心亮点:

有个演示案例挺疯的:仅凭一个初始提示,Agent 独立消耗超过 700万个 Token 构建了一款赛车游戏。
定价:ChatGPT Free 用户也能试用。付费用户在4月2日前速率额度翻倍。不过说实话,AI 编程 Agent 吃 Token 的速度,Plus 的额度可能撑不了多久。
同一天,OpenAI 放出了 ChatGPT for Excel(Beta),直接把 ChatGPT 嵌入到 Excel 工作簿里。
这不是那种帮你写个 VLOOKUP 的简单助手。它能:

ChatGPT for Excel 界面
配套的金融数据集成更猛:FactSet、Moody's、MSCI、S&P Global、Dow Jones Factiva 全接进来了。咨询合作伙伴包括麦肯锡、贝恩、BCG、埃森哲、普华永道。
在内部投行基准测试上,模型从 GPT-5 的 43.7% 飙到 GPT-5.4 Thinking 的 **87.3%**。这意味着初级分析师的电子表格建模工作,AI 已经能做到接近九成的水平。
目前限美国、加拿大、澳大利亚的 Business/Enterprise/Pro/Plus 用户
Google Sheets 版即将推出
3月5日,GPT-5.4 正式发布
这是 OpenAI 目前最强的模型,也是这波密集发布的压轴
一句话概括:编码能力 + 推理能力 + 计算机操控,三合一。
基准 | GPT-5.4 | GPT-5.2 | 说明 |
|---|---|---|---|
OSWorld(计算机操控) | 75.0% | 47.3% | 人类表现 72.4%,GPT-5.4 超越人类 |
GDPval(知识工作) | 83.0% | 70.9% | 在44个职业中匹配/超过行业专家 |
ARC-AGI-2(抽象推理) | 73.3% | 52.9% | +20.4% |
BrowseComp(网络搜索) | 82.7% | 65.8% | Pro版达到 89.3% |
IB 建模(投行任务) | 87.3% | 68.4% | +18.9% |
SWE-Bench Pro(编码) | 57.7% | 55.6% | 整合了 5.3-Codex 的编码能力 |
MMMU Pro(视觉理解) | 81.2% | 79.5% | 超过 Gemini 3.1 Pro 的 80.5% |
OSWorld 超越人类表现这个事,我觉得是这次发布最值得关注的数据点。计算机操控这个领域,从"能用"到"超过人",GPT-5.4 迈了一大步。
模型 | 输入 | 输出 |
|---|---|---|
gpt-5.4 | $2.50/M tokens | $15/M tokens |
gpt-5.4-pro | $30/M tokens | $180/M tokens |
比 GPT-5.2 贵了一点点(输入 2.50),但考虑到 token 效率提升,实际成本可能差不多。
OpenAI 同步发布了详细的安全评估报告。几个值得关注的点:
说完产品,聊聊背景。
根据36氪报道,Anthropic(Claude)的年化收入已接近 200亿美元,两周内增长50亿。Claude Code 单产品年化收入突破 25亿美元。更夸张的是,2026年2月 Anthropic 在美国市场份额飙升至近 70%,OpenAI 降到约 30%。一年前这个比例还是反的。
API 花费方面,Anthropic 占据 90% 份额。全球 GitHub 上 4% 的公开代码提交由 Claude Code 生成。
所以你能理解 OpenAI 为什么一周四连发了——市场份额在流失,必须快速刷存在感。GPT-5.4 + Codex 桌面端 + Excel 插件 + 金融数据生态,这套组合拳打的就是"从模型到应用到生态"的全栈覆盖。
有意思的是,与此同时 Anthropic 因为坚持 AI 安全准则被美国国防部封杀,被定性为"供应链风险"。OpenAI 则迅速填补了这个缺口。全球已有约250万人加入了 QuitGPT 抵制运动,社交媒体相关帖子播放量突破3600万。奥特曼自己都承认"吃相难看"。
一边是产品力的狂飙,一边是舆论场的反噬。2026年的 AI 竞争,比以往任何时候都更像一场多维度的战争。
这周 OpenAI 的发布密度确实罕见。简单排个优先级:
OpenAI 能不能靠这波追回来?还是说 Claude 的势头已经不可逆?我觉得短期看产品力,长期看生态。这场仗,远没打完。
#OpenAI #GPT5.4 #Codex #ChatGPTforExcel #AI竞争
制作不易,如果这篇文章觉得对你有用,可否点个关注。给我个三连击:点赞、转发和在看。若可以再给我加个🌟,谢谢你看我的文章,我们下篇再见!