Sam Sabin · 2026-02-06

Anthropic新模型发现500多个零日漏洞

摘要

Anthropic最新发布的Claude Opus 4.6模型在安全测试中表现出色，无需专门指令便自主发现了500多个此前未知的开源软件高危漏洞。该模型利用先进的推理能力，结合调试器和模糊测试等工具，成功识别了GhostScript、OpenSC等开源库中的内存损坏和系统崩溃风险。Anthropic表示这是网络防御领域的重要转折点，同时已添加安全控制措施防止技术被滥用。

内容框架与概述

Anthropic在发布Claude Opus 4.6前进行了前沿红队测试，给予模型标准工具但无具体指令，结果模型自主发现了500多个零日漏洞并通过安全研究人员验证。这一成果标志着AI安全工具的质变，从被动辅助转向主动发现。模型展现出超越传统工具的推理能力，能够追溯代码提交历史、自行编写概念验证程序来确认漏洞。Anthropic强调这是防御者与攻击者竞赛中的重要进展，同时警告需防范技术滥用风险。