何が起きたか
Anthropicは自社の6つのClaudeモデルを対象に、セキュリティパッチからエクスプロイトを開発できるかを評価した。対象は未公開の「Mythos Preview」をはじめ、Opus 4.5、Opus 4.7、Opus 4.8、Sonnet 4.6など。テストはFirefoxのJavaScriptエンジン「SpiderMonkey」とWindowsカーネルの2領域で実施された。
SpiderMonkeyでの結果
SpiderMonkeyに対しては18件のセキュリティパッチを検証対象とした。Mythos Previewは18件中14件の脆弱性を特定し、最初のProof of Concept(PoC)を12分で生成。その後40分で13件追加、14件目は3時間で完成した。信頼性テスト(各脆弱性50回実行)では、7件について100%の再現性を示した。最終的に8つの動作するエクスプロイトを12時間以内に開発した。
比較として、Opus 4.5は同テストで2件、Opus 4.8は11件のエクスプロイトを完成させており、モデルの世代差が成果に大きく影響している。なお、Firefox 148のリリースは評価から18日後であった。
Windowsカーネルでの結果
2026年1月・2月のPatch Tuesdayで公開された21件のWindowsカーネル脆弱性を対象に、ソースコードなしでバイナリ解析ツール「Ghidra」のみを使用して評価した。Mythos Previewは6時間以内に18件の脆弱性を特定し、8つの特権昇格チェーン(制限ユーザーからSYSTEM管理者への昇格)を完成させた。総APIコストは1万5,700ドル(1エクスプロイトあたり平均2,000ドル)。
Microsoftが「悪用される可能性が低い」と分類した14件のうち、Mythos Previewは13件でエクスプロイトを完成させた点も注目に値する。
パッチ適用サイクルとのギャップ
8つのWindowsエクスプロイトはすべて、デバイスの90%が自動パッチを適用するまでに必要とされる最低7日間(強制再起動まで11日)を前に完成した。Windows Autopatchを利用していても、この時間差は埋まらない。
2020年のMandiant分析では、25件の脆弱性のうち16件で悪用までに1か月以上を要していた。現在のパッチ展開サイクルはそうした前提のもとで設計されており、エクスプロイト開発が数時間に短縮される現実とのズレが生じている。
安全フィルター無効化時のリスク
Anthropicによれば、公開済みのClaudeモデルも安全フィルターを無効化した場合にエクスプロイトを開発できることが確認されている。Mythos Previewは現時点で一般公開されていない。
出典:The Decoder