一次能独立编程7小时!OpenAI发布GPT-5-Codex

2025年09月16日,08时55分48秒 科技新知 阅读 2 views 次

9月16日消息,周一,OpenAI正式推出新一代AI模型GPT-5-Codex,为其智能编程助手Codex注入全新动力。该模型凭借“动态思考”能力,可自主处理复杂的智能体软件工程任务。

作为GPT-5的专项优化版本,GPT-5-Codex针对“智能体编码”场景深度定制,能够持续数小时独立完成复杂的编程任务,其核心能力涵盖调试、大规模代码重构和从零构建项目。这一模型旨在为开发者打造更统一的“虚拟编程伙伴”,并在竞争日益激烈的AI编程市场中直面微软、谷歌等对手的挑战。

从9月15日起,GPT-5-Codex将陆续集成至Codex的全系列产品中,开发者可通过终端、集成开发环境(IDE)、GitHub、网页端或ChatGPT使用该工具。它将成为云端任务和代码审查的默认引擎,同时支持通过Codex命令行接口(CLI)和IDE插件在本地运行。

一次能独立编程7小时!OpenAI发布GPT-5-Codex

OpenAI表示,未来将在其应用程序编程接口(API)中增加该模型的选项,方便开发者更便捷地集成到现有应用或开发新应用。目前,所有付费ChatGPT用户,包括Plus、Pro、Business、Edu和Enterprise套餐的订阅者,均可使用该模型。

自OpenAI于4月份推出开源CLI、5月份发布网页版以来,Codex在功能上持续演进。两周前,OpenAI将这些功能整合为与ChatGPT账户联通的统一体验,使开发者能够在本地和云端环境间无缝切换而不丢失上下文。而GPT-5-Codex的推出,则在这一基础上进一步强化了其工程实践能力。

专属定制的智能编程引擎

与通用型GPT-5不同,GPT-5-Codex专为“智能体编码”优化,其本质是让AI智能体担任开发者的协作伙伴,能够独立完成编码、测试和修改等任务,单次持续工作时长可超过7小时。

这听起来与科技网站VentureBeat创始人马特·马歇尔(Matt Marshall)提出的“智能体群”趋势有相似之处,但侧重不同:后者强调多个(3个或更多)具备不同角色的智能体进行协同作业,而GPT-5-Codex则专注于提升单个智能体的深度工作能力。

OpenAI表示,GPT-5-Codex基于真实的工程任务训练,覆盖调试、添加测试、项目搭建和大规模重构等场景,特别在代码审查方面表现突出。它不仅能理解代码库结构,还能推理依赖关系并通过测试验证代码的正确性。

GPT-5-Codex的核心创新在于其“自适应思考”能力,即可根据任务复杂度自主调整推理时间。对于错误修复等简单任务,响应速度较前代提升明显;而面对复杂项目时,它则能持续运行数小时。测试中,该模型曾独立完成了持续超过7小时的重构任务,通过多次迭代最终交付了可用的方案。

一次能独立编程7小时!OpenAI发布GPT-5-Codex

OpenAI的Codex产品负责人亚历山大·恩比里科斯(Alexander Embiricos)指出:“GPT-5-Codex可在处理任务5分钟后,自主判断是否需要额外投入1小时继续工作。”这种动态决策能力不依赖于GPT-5的“路由机制”,而是通过模型内生的训练过程实现,使开发者无需手动调整即可处理不同时长的任务。

目前,OpenAI内部已将GPT-5-Codex集成至代码审查流程,每日可发现数百个问题。值得注意的是,在此次发布前,Codex已基于通用GPT-5模型运行约一个月,而此次升级标志着其正式转向专为智能体软件工程打造的模型。

全链路开发生态升级

伴随着新模型的发布,Codex产品线也迎来多项功能增强:

·Codex CLI:已围绕智能体工作流全面重构。CLI允许开发者直接附加图像(如线框图或截图)、共享上下文,并通过内置的待办清单跟踪任务进度。它还新增了简化的审批模式、更规范的工具调用与差异(diff)格式展示,以及对更长会话的支持。OpenAI已将CLI开源,这意味着团队可以检查或扩展这一衔接模型与开发环境的工具套件。

·Codex IDE插件:现已支持VS Code、Cursor及类似的编辑器。该插件让开发者能够在编辑器内直接预览本地修改并调用Codex编辑代码,同时在云端与本地环境间切换时保持上下文一致,实现更顺畅的协作。OpenAI表示,该IDE插件已迅速成为最受欢迎的使用方式。

·Codex云端环境:在后台,OpenAI对底层架构进行了优化,使任务完成的平均时间缩短了90%。云端智能体现在能够自动配置环境、按需安装依赖项,并支持UI任务的截图处理。开发者可以将前端任务交给Codex,它会自动启动浏览器、检查进度,并将截图附加到GitHub的拉取请求中。此外,Codex还新增了直接输出截图的功能,开发者无需在本地运行代码即可直观确认结果。

·代码审查自动化:在GitHub仓库中启用后,Codex会在拉取请求的各个阶段自动进行审查,发现问题并在同一讨论线程中提出修复建议,甚至可以直接应用修改。开发者还可请求专项审查,例如安全漏洞检测。与传统静态分析工具不同,Codex会获取完整的代码库,跨依赖关系进行推理,并在反馈前运行测试。

开发者反馈与内部应用

早期使用者的反馈显示,Codex正在改变开发工作流程。

Duolingo高级软件工程师亚纶·王(Aaron Wang)表示,Codex在后端代码审查中超越了其他工具,能发现兼容性问题和其他工具遗漏的缺陷。

维珍大西洋公司数据与AI副总裁理查德·马斯特斯(Richard Masters)指出,现在只需在拉取请求中留言,Codex几乎能即时生成更新,大幅减少沟通成本。

在Cisco Meraki,技术主管Tres Wong-Godfrey借助Codex完成了另一团队代码库的复杂重构工作。这不仅使他能更专注于其他优先事项,Codex还交付了经过充分测试的高质量代码。

Vanta公司高级人工智能机器学习工程师凯文·罗伊尔(Kevin Royer)表示,Codex通过在后台处理任务并返回清晰易懂的反馈,有效帮助他保持工作的流畅性。

Ramp公司AI Dev X团队负责人奥斯汀·雷伊(Austin Ray)特别提到,Codex成功发现了一个被其他代码审查工具遗漏的活动错误。

在OpenAI内部,Codex也已成为安全、前端和基础设施等领域团队日常开发中的“编外队员”。过去一个月中,Codex的使用量增长达十倍,体现出其在内外部应用中的依赖度显著提升。

安全机制与定价策略

OpenAI强调,Codex始终运行于沙盒环境中,无论是在云端还是本地部署,默认均禁用网络访问。开发者可根据需要授权特定功能(如网络搜索或外部工具连接),但OpenAI仍建议部署前对Codex的输出结果进行人工审核。

此外,针对生物、化学等敏感领域,OpenAI将GPT-5-Codex归类为“高能力”模型,并已实施相应的保障措施以严格控制潜在风险其定位并非取代人工代码审查,而是作为额外的质量保障层。

Codex已全面集成于OpenAI的付费订阅服务中,包括ChatGPT Plus(20美元/月)、Pro(200美元/月)、Business(25美元/用户/月)、教育版(Edu)和企业版(Enterprise),但后两个版本尚未公开定价。

各版本的使用限制有所不同:Plus、Edu和Business版本每周提供有限次数的专注编程会话;Pro版本则支持跨多个项目的整周开发;Business版本提供可扩展的额外信用额度;Enterprise版本则为大型团队设计了共享信用池。

战略定位:与Copilot互补

通过GPT-5-Codex,OpenAI将Codex的定位提升为一个智能编程伙伴,远超传统的自动补全或调试工具。它能自适应不同规模的任务需求,自主决策工作时间,并深度集成到开发流程中,为开发者提供跨环境的一致体验。

值得注意的是,OpenAI明确表示Codex不与GitHub Copilot等代码补全工具竞争,而是形成互补关系:开发者可同时使用两者,即Copilot专注于代码级的实时辅助,而Codex致力于更高阶的任务委托和自动化开发。(小小)

(来源:网易科技)



用户登录