Sam Sabin · 2026-02-06

Anthropic新模型发现500多个零日漏洞

摘要

Anthropic最新发布的Claude Opus 4.6模型在安全测试中表现出色,无需专门指令便自主发现了500多个此前未知的开源软件高危漏洞。该模型利用先进的推理能力,结合调试器和模糊测试等工具,成功识别了GhostScript、OpenSC等开源库中的内存损坏和系统崩溃风险。Anthropic表示这是网络防御领域的重要转折点,同时已添加安全控制措施防止技术被滥用。

内容框架与概述

Anthropic在发布Claude Opus 4.6前进行了前沿红队测试,给予模型标准工具但无具体指令,结果模型自主发现了500多个零日漏洞并通过安全研究人员验证。这一成果标志着AI安全工具的质变,从被动辅助转向主动发现。模型展现出超越传统工具的推理能力,能够追溯代码提交历史、自行编写概念验证程序来确认漏洞。Anthropic强调这是防御者与攻击者竞赛中的重要进展,同时警告需防范技术滥用风险。

核心概念及解读

零日漏洞:软件中未知且未公开的缺陷,在被发现前厂商无修复方案,攻击者可利用此窗口实施入侵。

前沿红队测试:安全团队模拟真实攻击者思维,主动寻找系统弱点以提升整体防御能力的方法。

模糊测试:通过向程序输入大量随机或异常数据,触发潜在崩溃或异常行为以发现安全漏洞的技术。

内存损坏:程序错误访问或操作内存区域,可能导致系统崩溃或被攻击者执行任意代码。

AI安全控制:Anthropic为防止模型能力被恶意利用而设置的实时检测和响应机制。


原文信息

字段内容
原文Anthropics newest AI model uncovered 500 zero-day software flaws in testing
作者Sam Sabin
发表日期2026-02-06

此摘要卡片由 AI 自动生成