OpenAI · 2026-02-05

GPT-5.3-Codex发布：最强大的代理编码模型

摘要

OpenAI推出GPT-5.3-Codex，这是目前最强大的代理编码模型。该模型融合了GPT-5.2-Codex的前沿编码性能与GPT-5.2的推理能力，速度提升25%，能够处理需要研究、工具使用和复杂执行的长期任务。GPT-5.3-Codex在SWE-Bench Pro和Terminal-Bench等基准测试中创下行业新高，并首次在自身开发过程中发挥了关键作用。

内容框架与概述

文章首先介绍了GPT-5.3-Codex的核心定位，指出这是OpenAI最强大的代理编码模型，整合了编码性能与推理能力，并实现了显著的速度提升。文章强调了该模型处理长期复杂任务的能力，以及在工作中与用户互动的流畅性。随后披露了一个重要里程碑：GPT-5.3-Codex是OpenAI首个在自身开发过程中发挥关键作用的模型，被团队用于调试训练、管理部署和诊断测试结果。文章最后展示了该模型在多个行业基准测试中的卓越表现，特别是在SWE-Bench Pro和Terminal-Bench上创下新纪录，同时保持了高效率。

核心概念及解读

代理编码模型：能够自主执行编码任务的AI模型，可进行代码编写、调试、审查，并能独立完成长期复杂的开发工作流程。GPT-5.3-Codex将这一概念扩展到几乎可以完成开发者在计算机上的任何操作。

SWE-Bench Pro：严格的真实世界软件工程评估基准，相比仅测试Python的SWE-Bench Verified，该基准涵盖四种编程语言，更具抗污染性、挑战性和行业相关性。

Terminal-Bench 2.0：评估编码代理终端技能的基准测试，衡量模型在命令行环境中的操作能力。GPT-5.3-Codex在该测试中以最少的令牌消耗创下新纪录。

自我开发能力：GPT-5.3-Codex在自身训练过程中发挥了重要作用，被用于调试自身训练代码、管理部署流程和诊断测试结果，代表了AI模型发展的重要里程碑。

原文信息

字段	内容
原文	Introducing GPT-5.3-Codex
作者	OpenAI
发表日期	2026-02-05

此摘要卡片由 AI 自动生成

‹

GitHub Agent HQ 更新：支持 Claude 和 Codex 多代理协同

Mario Rodriguez · 2026-02-05

ICE备忘录引争议被要求解释收集抗议者信息事件

Jon Brodkin · 2026-02-05

›

GPT-5.3-Codex发布：最强大的代理编码模型

摘要

内容框架与概述

核心概念及解读

原文信息

目录