2026年2月:Anthropic与OpenAI模型对决
摘要
本文报道了2026年2月6日Anthropic与OpenAI的同步发布对决。Anthropic推出Claude Opus 4.6,在编程能力和1M token上下文窗口取得突破;OpenAI发布GPT-5.3-Codex,融合推理与编程能力并在Terminal-Bench测试中领先。两家公司同时推出多款配套产品,Anthropic的Agent Teams支持多智能体协作,OpenAI推出Frontier企业平台,传统SaaS企业股价因此受冲击。
内容框架与概述
文章首先介绍了Anthropic发布的Claude Opus 4.6模型,该版本在编程能力、长上下文处理和知识工作方面有显著提升,并配套推出Agent Teams、Claude in Excel升级和Claude in PowerPoint等新产品。接着转向OpenAI的GPT-5.3-Codex,强调其融合编程与推理能力、在Terminal-Bench基准测试中超越Opus 4.6的表现,以及从编码工具向全能操作员的转型。文章随后概述了两家公司同步发布的时间节点和市场竞争态势,指出传统SaaS企业受此冲击股价下跌,并预告双方将在超级碗投放竞争广告。最后简要列举了已跟进支持新模型的多家产品。
核心概念及解读
Claude Opus 4.6:Anthropic最新旗舰模型,编程能力大幅提升,支持1M token上下文窗口,在多项基准测试中表现优异,定价保持不变。
GPT-5.3-Codex:OpenAI新发布的融合模型,将GPT-5.2-Codex的编程能力与GPT-5.2的推理能力结合,速度提升25%,token消耗减半。
Agent Teams:Claude Code新功能,支持多个Claude实例并行协作,一角色领导分配任务,队友独立工作并相互通信,适用于代码审查等并行任务。
Terminal-Bench 2.0:斯坦福开发的CLI智能体基准测试,GPT-5.3-Codex得分77.3%,Opus 4.6得分65.4%,是当前最具含金量的编程能力测试。
Frontier平台:OpenAI发布的企业级AI智能体平台,称为语义操作系统,支持跨系统数据整合和智能体管理,已与Snowflake达成合作。
原文信息
| 字段 | 内容 |
|---|---|
| 原文 | Thread by @kevinma_dev_zh |
| 作者 | @kevinma_dev_zh |
| 发表日期 | 2026-02-06 |
此摘要卡片由 AI 自动生成