Claude Fable 5、ベンチマーク首位も性能向上5.7%でコストは2倍——費用対効果に課題

AnthropicのClaude Fable 5がArtificial Analysis Intelligence Indexで64.9点を獲得し首位に立ったが、前世代のClaude Opus 4.8と比べた性能向上は5.7%にとどまる一方、APIコストは入力・出力ともに2倍に設定されている。

ベンチマーク首位、ただし差は限定的

Anthropicが投入したClaude Fable 5は、Artificial Analysis Intelligence Indexで64.9点を獲得し、全モデル中1位となった。2位はOpenAIのGPT-5.5で、約5点差。非Anthropicモデルの中では最高位だが、Fable 5との差は明確に存在する。

10項目のベンチマークのうち5項目でFable 5は最高記録を更新した。知識テストAA-Omniscienceでは40点を記録し、それまで首位だったGemini 3.1 Pro Previewを7点上回った。エージェントタスクのGDPval-AAではEloレーティング1,932を達成し、Opus 4.8の1,890から2.2%改善。Terminal-Bench HardとTau2-bench Telecomでもトップとなった。難易度の高い知識テストHumanity’s Last Examでは53%を記録し、Opus 4.8を7ポイント以上上回っている。

幻覚率と安全フィルターの影響

一方で課題も確認されている。AA-OmniscienceにおけるFable 5の幻覚率は55%で、全体の中位に位置する。首位を取りながら事実性の面では優位性を示せていない。

Fable 5はClaude Mythos 5と同じベースモデルを使用しているが、サイバーセキュリティ・生物・化学・モデル蒸留に関する安全フィルターが追加されている。フィルターに引っかかったリクエストはOpus 4.8へ自動的にルーティングされる仕組みで、Anthropicは影響を受けるセッションを5%未満と説明しているが、Artificial Analysisの計測では約8%のタスクでフォールバックが発生した。Humanity’s Last Examのテストでは9%のフォールバック率が記録されており、実際の運用では公式発表より影響が大きい可能性がある。

コストは前世代の2倍

APIの料金体系は、入力トークン100万件あたり10ドル、出力トークン100万件あたり50ドル。Opus 4.8の5ドル・25ドルと比較すると、いずれも2倍の価格設定となる。Intelligence Indexのフルテストを実行した場合、Fable 5では9,940ドルかかるのに対し、Opus 4.8では4,970ドルで済む。

コストを2倍にしながら性能向上が5.7%にとどまるという構造は、コスト効率を重視する企業にとって導入の判断を複雑にする。Fable 5はOpus 4.8と同じ100万トークンのコンテキストウィンドウを維持しており、新機能として目立った拡張はない。

サブスクリプション経由のアクセスは6月22日まで、Opusレートの2倍で提供される。それ以降はクレジットベースの課金に移行する。

出典：The Decoder

よくある質問

Claude Fable 5は他のモデルと比べてどのくらい優れているのですか？

Artificial Analysis Intelligence Indexでは64.9点で首位ですが、2位のGPT-5.5との差は約5点、前世代のOpus 4.8からの性能向上は5.7%です。特定のベンチマークでは顕著な差がありますが、全体的な優位性は限定的です。

安全フィルターのフォールバックとは何ですか？

Fable 5にはサイバーセキュリティ・生物・化学・モデル蒸留に関する安全フィルターが設けられており、該当するリクエストは自動的にClaude Opus 4.8で処理されます。Anthropicは影響を5%未満としていますが、第三者機関の計測では約8〜9%のタスクでこのフォールバックが発生したとされています。

サブスクリプションでFable 5を使う場合、いつまで現在の料金が適用されますか？

6月22日までは現行のサブスクリプション料金（Opusレートの2倍）でアクセスできます。それ以降はクレジットベースの課金体系に移行します。

本記事は The Decoder の報道を元に、事実に基づき独自に再構成したものです。

Claude Fable 5、ベンチマーク首位も性能向上5.7%でコストは2倍——費用対効果に課題

ベンチマーク首位、ただし差は限定的

幻覚率と安全フィルターの影響

コストは前世代の2倍

関連リンク

よくある質問

関連記事

Claudeの「共有チャット」がGoogle検索に露出——AnthropicのAI会話公開機能に潜むリスクとは

Claudeの共有会話がGoogle検索に露出？共有リンクとArtifactsのインデックス問題を解説

Opus 5とは？「性能の飛躍」より「半額」を選んだAnthropicの狙いを解説