Claude Fable 5とは？AnthropicのMythosクラス初公開モデルの安全制御を解説

Anthropicは火曜、初のMythosクラスとなる「Claude Fable 5」を公開しました。サイバー・生物・化学領域の質問は遮断または旧モデルClaude Opus 4.8へ転送する設計で、レッドチーム検証1,000時間超でも普遍的な脱獄手法は見つかっていません。

何が公開されたか

Anthropicは火曜、新世代「Mythosクラス」の一般向けモデルとして「Claude Fable 5」をリリースしました。従来フロンティアであったOpus系を総合性能で上回るとされ、内部の最上位モデル「Mythos 5」と「same underlying model（同一の基盤モデル）」を共有しています。Mythos 5自体は数カ月のプレビューを経て、Project Glasswingで信頼性が認められた「a small group of cyberdefenders（少数のサイバー防御専門家）」だけに限定提供されます。

安全制御の作り

公開版Fable 5は、サイバーセキュリティ・生物・化学に関する質問を検出する分類器を搭載し、該当時には旧モデルClaude Opus 4.8へ自動的に振り替え、その旨をユーザーに通知します。Anthropicはこの閾値を意図的に「stricter than ideal（理想より厳しい）」に設定しており、無害な質問でも拒否されるケースが「全セッションの5%未満」発生するとしています。1,000時間超の外部レッドチーム検証およびバグバウンティでは、普遍的な脱獄手法は発見されませんでした。

なぜここまで絞るのか

背景にあるのは「agentic hacking（自律的なサイバー攻撃の実行)」への懸念です。英AI Security Instituteの検証では、Mythos PreviewはCapture the Flag課題でOpenAIのGPT-5.5と同等水準を示し、なかでもサイバー領域のベンチマーク向上幅が他項目より突出していました。能力向上が「uplift（悪用者の底上げ）」につながるリスクを抱えるため、Anthropicは汎用提供と限定提供を分けるという珍しい二層運用に踏み切ったと読み取れます。

💼 事業会社視点：これは自社にどう効くか

事業会社の経営者・事業責任者が注視すべきは「フロンティアモデルの提供形態が二層化する」流れです。最新モデルが必ずしも全顧客に同条件で開かれない以上、SaaSやAIエージェントを構築する事業者は、利用するモデルが沈黙・拒否・旧モデル転送を返した場合のUXとSLAをあらかじめ設計に織り込む必要があります。とくにセキュリティ製品、医薬・化学R&D支援、研究受託開発のような領域では、Fable 5を採用すると5%未満とはいえ正当業務クエリが弾かれ得るため、Opus 4.8など旧バージョンへのフォールバック経路や、用途証明を前提とした上位枠（Project Glasswing型）の調達ルートを並走させる体制が現実解になります。日本のSIerやEC事業者は「最新=最良」ではなく「業務目的に対する制御許容度」でモデルを選ぶ調達基準への切り替えが急務です。

よくある質問

Claude Fable 5とMythos 5は何が違うのですか?

両者は同一の基盤モデルを共有しますが、Fable 5が一般公開モデルで安全制御が組み込まれているのに対し、Mythos 5はProject Glasswingで信頼性を認められた少数のサイバー防御専門家にのみ提供されます。

Fable 5はどのような質問を拒否しますか?

分類器がサイバーセキュリティ・生物・化学に関する質問や脱獄試行を検出し、該当する場合は旧モデルClaude Opus 4.8へクエリを転送した上でユーザーに通知します。Anthropicは閾値を意図的に厳しめに設定しているとしています。

安全制御は突破されないのですか?

Anthropicは1,000時間超のレッドチーム検証とバグバウンティを実施し、外部チームは普遍的な脱獄手法を発見できなかったとしています。ただし英AI Security Instituteの検証ではサイバー領域の能力がGPT-5.5と同等水準まで上がっており、引き続きリスクは存在します。

本記事は Ars Technica の報道を元に、事実に基づき独自に再構成したものです。

Claude Fable 5とは？AnthropicのMythosクラス初公開モデルの安全制御を解説

何が公開されたか

安全制御の作り

なぜここまで絞るのか

💼 事業会社視点：これは自社にどう効くか

関連リンク

よくある質問

関連記事

Claude Fable 5が世界復帰、Mythos 5は米国限定継続——輸出規制3週間の顛末と日本企業への含意

Claude Fable 5・Mythos 5の提供停止とは？米輸出規制が示すAI規制の限界と次の論点

Claude Mythos 5/Fable 5の世界停止命令とは？米政府の輸出管理発動が示すAI調達リスクを解説