当地时间9月15日,OpenAI推出了GPT-5-Codex模型,该模型是在GPT-5基础上专门针对软件工程进行优化的版本。它基于复杂且真实的现实世界编程任务进行训练,涵盖从头构建完整项目、添加新功能与测试、执行大规模代码重构以及进行代码安全审查等方面。
GPT-5-Codex具备更出色的指令遵循能力,能更好地依照AGENTS.md中的指令行事,并且能够生成质量更高的代码。OpenAI团队的测试结果显示,GPT-5-Codex在处理大型复杂任务时,能够独立工作超过7个小时。
在GPT-5-Codex发布两个多小时后,OpenAI联合创始人兼CEO萨姆·阿尔特曼(Sam Altman)在X平台上透露,GPT-5-Codex的流量占比已达到Codex总流量的约40%,并且预计当天就能超过一半。
为测试新模型的代码重构能力,OpenAI基于包含来自大型成熟代码库的重构风格任务展开测试,测试涉及Python、Go、OCaml等多种编程语言。结果显示,GPT-5-Codex在该测试中的准确率为51.3%,高于GPT-5的33.9%。
当前,AI编程工具领域的竞争愈发激烈。市场上有OpenAI Codex、Claude Code、Anysphere Cursor、微软GitHub Copilot等几大产品相互角逐。此外,Cursor的年度经常性收入(ARR)预计在2025年初将超过5亿美元。同时,AI代码编辑器Windsurf经历了一场混乱的收购,其团队被谷歌和Cognition两家公司瓜分。