一次能独立编程7小时！OpenAI发布GPT-5-Codex

2025年09月16日,08时55分48秒科技新知阅读 16 views 次

9月16日消息，周一，OpenAI正式推出新一代AI模型GPT-5-Codex，为其智能编程助手Codex注入全新动力。该模型凭借“动态思考”能力，可自主处理复杂的智能体软件工程任务。

作为GPT-5的专项优化版本，GPT-5-Codex针对“智能体编码”场景深度定制，能够持续数小时独立完成复杂的编程任务，其核心能力涵盖调试、大规模代码重构和从零构建项目。这一模型旨在为开发者打造更统一的“虚拟编程伙伴”，并在竞争日益激烈的AI编程市场中直面微软、谷歌等对手的挑战。

从9月15日起，GPT-5-Codex将陆续集成至Codex的全系列产品中，开发者可通过终端、集成开发环境（IDE）、GitHub、网页端或ChatGPT使用该工具。它将成为云端任务和代码审查的默认引擎，同时支持通过Codex命令行接口（CLI）和IDE插件在本地运行。

OpenAI表示，未来将在其应用程序编程接口（API）中增加该模型的选项，方便开发者更便捷地集成到现有应用或开发新应用。目前，所有付费ChatGPT用户，包括Plus、Pro、Business、Edu和Enterprise套餐的订阅者，均可使用该模型。

自OpenAI于4月份推出开源CLI、5月份发布网页版以来，Codex在功能上持续演进。两周前，OpenAI将这些功能整合为与ChatGPT账户联通的统一体验，使开发者能够在本地和云端环境间无缝切换而不丢失上下文。而GPT-5-Codex的推出，则在这一基础上进一步强化了其工程实践能力。

专属定制的智能编程引擎

与通用型GPT-5不同，GPT-5-Codex专为“智能体编码”优化，其本质是让AI智能体担任开发者的协作伙伴，能够独立完成编码、测试和修改等任务，单次持续工作时长可超过7小时。

这听起来与科技网站VentureBeat创始人马特·马歇尔（Matt Marshall）提出的“智能体群”趋势有相似之处，但侧重不同：后者强调多个（3个或更多）具备不同角色的智能体进行协同作业，而GPT-5-Codex则专注于提升单个智能体的深度工作能力。

OpenAI表示，GPT-5-Codex基于真实的工程任务训练，覆盖调试、添加测试、项目搭建和大规模重构等场景，特别在代码审查方面表现突出。它不仅能理解代码库结构，还能推理依赖关系并通过测试验证代码的正确性。

GPT-5-Codex的核心创新在于其“自适应思考”能力，即可根据任务复杂度自主调整推理时间。对于错误修复等简单任务，响应速度较前代提升明显；而面对复杂项目时，它则能持续运行数小时。测试中，该模型曾独立完成了持续超过7小时的重构任务，通过多次迭代最终交付了可用的方案。

OpenAI的Codex产品负责人亚历山大·恩比里科斯（Alexander Embiricos）指出：“GPT-5-Codex可在处理任务5分钟后，自主判断是否需要额外投入1小时继续工作。”这种动态决策能力不依赖于GPT-5的“路由机制”，而是通过模型内生的训练过程实现，使开发者无需手动调整即可处理不同时长的任务。

目前，OpenAI内部已将GPT-5-Codex集成至代码审查流程，每日可发现数百个问题。值得注意的是，在此次发布前，Codex已基于通用GPT-5模型运行约一个月，而此次升级标志着其正式转向专为智能体软件工程打造的模型。

全链路开发生态升级

伴随着新模型的发布，Codex产品线也迎来多项功能增强：

·Codex CLI：已围绕智能体工作流全面重构。CLI允许开发者直接附加图像（如线框图或截图）、共享上下文，并通过内置的待办清单跟踪任务进度。它还新增了简化的审批模式、更规范的工具调用与差异（diff）格式展示，以及对更长会话的支持。OpenAI已将CLI开源，这意味着团队可以检查或扩展这一衔接模型与开发环境的工具套件。

·Codex IDE插件：现已支持VS Code、Cursor及类似的编辑器。该插件让开发者能够在编辑器内直接预览本地修改并调用Codex编辑代码，同时在云端与本地环境间切换时保持上下文一致，实现更顺畅的协作。OpenAI表示，该IDE插件已迅速成为最受欢迎的使用方式。

·Codex云端环境：在后台，OpenAI对底层架构进行了优化，使任务完成的平均时间缩短了90%。云端智能体现在能够自动配置环境、按需安装依赖项，并支持UI任务的截图处理。开发者可以将前端任务交给Codex，它会自动启动浏览器、检查进度，并将截图附加到GitHub的拉取请求中。此外，Codex还新增了直接输出截图的功能，开发者无需在本地运行代码即可直观确认结果。

·代码审查自动化：在GitHub仓库中启用后，Codex会在拉取请求的各个阶段自动进行审查，发现问题并在同一讨论线程中提出修复建议，甚至可以直接应用修改。开发者还可请求专项审查，例如安全漏洞检测。与传统静态分析工具不同，Codex会获取完整的代码库，跨依赖关系进行推理，并在反馈前运行测试。

开发者反馈与内部应用

早期使用者的反馈显示，Codex正在改变开发工作流程。

Duolingo高级软件工程师亚纶·王（Aaron Wang）表示，Codex在后端代码审查中超越了其他工具，能发现兼容性问题和其他工具遗漏的缺陷。

维珍大西洋公司数据与AI副总裁理查德·马斯特斯（Richard Masters）指出，现在只需在拉取请求中留言，Codex几乎能即时生成更新，大幅减少沟通成本。

在Cisco Meraki，技术主管Tres Wong-Godfrey借助Codex完成了另一团队代码库的复杂重构工作。这不仅使他能更专注于其他优先事项，Codex还交付了经过充分测试的高质量代码。

Vanta公司高级人工智能与机器学习工程师凯文·罗伊尔（Kevin Royer）表示，Codex通过在后台处理任务并返回清晰易懂的反馈，有效帮助他保持工作的流畅性。

Ramp公司AI Dev X团队负责人奥斯汀·雷伊（Austin Ray）特别提到，Codex成功发现了一个被其他代码审查工具遗漏的活动错误。

在OpenAI内部，Codex也已成为安全、前端和基础设施等领域团队日常开发中的“编外队员”。过去一个月中，Codex的使用量增长达十倍，体现出其在内外部应用中的依赖度显著提升。

安全机制与定价策略

OpenAI强调，Codex始终运行于沙盒环境中，无论是在云端还是本地部署，默认均禁用网络访问。开发者可根据需要授权特定功能（如网络搜索或外部工具连接），但OpenAI仍建议部署前对Codex的输出结果进行人工审核。

此外，针对生物、化学等敏感领域，OpenAI将GPT-5-Codex归类为“高能力”模型，并已实施相应的保障措施以严格控制潜在风险。其定位并非取代人工代码审查，而是作为额外的质量保障层。

Codex已全面集成于OpenAI的付费订阅服务中，包括ChatGPT Plus（20美元/月）、Pro（200美元/月）、Business（25美元/用户/月）、教育版（Edu）和企业版（Enterprise），但后两个版本尚未公开定价。

各版本的使用限制有所不同：Plus、Edu和Business版本每周提供有限次数的专注编程会话；Pro版本则支持跨多个项目的整周开发；Business版本提供可扩展的额外信用额度；Enterprise版本则为大型团队设计了共享信用池。

战略定位：与Copilot互补

通过GPT-5-Codex，OpenAI将Codex的定位提升为一个智能编程伙伴，远超传统的自动补全或调试工具。它能自适应不同规模的任务需求，自主决策工作时间，并深度集成到开发流程中，为开发者提供跨环境的一致体验。

值得注意的是，OpenAI明确表示Codex不与GitHub Copilot等代码补全工具竞争，而是形成互补关系：开发者可同时使用两者，即Copilot专注于代码级的实时辅助，而Codex致力于更高阶的任务委托和自动化开发。（小小）

(来源：网易科技)

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

关联资讯:

用户登录