OpenAI · 2026-02-05

GPT-5.3-Codex发布:最强大的代理编码模型

摘要

OpenAI推出GPT-5.3-Codex,这是目前最强大的代理编码模型。该模型融合了GPT-5.2-Codex的前沿编码性能与GPT-5.2的推理能力,速度提升25%,能够处理需要研究、工具使用和复杂执行的长期任务。GPT-5.3-Codex在SWE-Bench Pro和Terminal-Bench等基准测试中创下行业新高,并首次在自身开发过程中发挥了关键作用。

内容框架与概述

文章首先介绍了GPT-5.3-Codex的核心定位,指出这是OpenAI最强大的代理编码模型,整合了编码性能与推理能力,并实现了显著的速度提升。文章强调了该模型处理长期复杂任务的能力,以及在工作中与用户互动的流畅性。随后披露了一个重要里程碑:GPT-5.3-Codex是OpenAI首个在自身开发过程中发挥关键作用的模型,被团队用于调试训练、管理部署和诊断测试结果。文章最后展示了该模型在多个行业基准测试中的卓越表现,特别是在SWE-Bench Pro和Terminal-Bench上创下新纪录,同时保持了高效率。

核心概念及解读

代理编码模型:能够自主执行编码任务的AI模型,可进行代码编写、调试、审查,并能独立完成长期复杂的开发工作流程。GPT-5.3-Codex将这一概念扩展到几乎可以完成开发者在计算机上的任何操作。

SWE-Bench Pro:严格的真实世界软件工程评估基准,相比仅测试Python的SWE-Bench Verified,该基准涵盖四种编程语言,更具抗污染性、挑战性和行业相关性。

Terminal-Bench 2.0:评估编码代理终端技能的基准测试,衡量模型在命令行环境中的操作能力。GPT-5.3-Codex在该测试中以最少的令牌消耗创下新纪录。

自我开发能力:GPT-5.3-Codex在自身训练过程中发挥了重要作用,被用于调试自身训练代码、管理部署流程和诊断测试结果,代表了AI模型发展的重要里程碑。


原文信息

字段内容
原文Introducing GPT-5.3-Codex
作者OpenAI
发表日期2026-02-05

此摘要卡片由 AI 自动生成