Anthropic「Fable」脱獄疑惑の真相は?セキュリティ専門家が読み解いた「仕様通り」の挙動
AnthropicのAI「Fable」が脆弱コードの修正に応じた件について、Luta Securityのカティ・ムスーリス氏が2026年6月16日、ホワイトハウス報告書を精査し「サイバー防御として意図通りに動作した」と結論づけました。同氏はAnthropicから報酬を受け取っていないと明言しています。
AnthropicのAI「Fable」が脆弱コードの修正に応じた件について、Luta Securityのカティ・ムスーリス氏が2026年6月16日、ホワイトハウス報告書を精査し「サイバー防御として意図通りに動作した」と結論づけました。同氏はAnthropicから報酬を受け取っていないと明言しています。
Anthropicが実施した内部評価で、未公開モデル「Mythos Preview」がWindowsカーネルの脆弱性21件中18件のエクスプロイトをソースコード非公開の状態から6時間以内に開発し、8つの特権昇格チェーンを完成させたことが明らかになった。従来は数週間を要するとされてきたエクスプロイト開発の前提が、AIによって根本から覆されつつある。
Anthropicは火曜、初のMythosクラスとなる「Claude Fable 5」を公開しました。サイバー・生物・化学領域の質問は遮断または旧モデルClaude Opus 4.8へ転送する設計で、レッドチーム検証1,000時間超でも普遍的な脱獄手法は見つかっていません。