何が発表されたか
Anthropicが「Claude Fable 5」と「Claude Mythos 5」をリリースしました。15のベンチマークで、社内のMythos Preview、Opus 4.8、GPT 5.5、Gemini 3.1 Proと比較しています。コーディング系のFrontierCodeでFable 5は29.3%を記録し、Opus 4.8の13.4%、GPT 5.5の5.7%を引き離しました。SWE-Bench Proでも80.3%に到達しています。
実務での生産性
StripeはFable 5を使い「5か月分のエンジニアリング作業を数日に圧縮した」と報告。5000万行規模のRubyコードベースでは、チーム総出で2か月超かかる移行を1日で終えたとされています。金融分野ではHebbiaのFinance Benchmarkで首位、トレーディング企業IMCは「ほぼ全ての分析評価をパスした」と評価しました。
科学領域で踏み込むMythos 5
Mythos 5は創薬プロセスの一部を10倍に高速化し、人間の支援なしに結合部位を選び、タンパク質設計ツールを起動し、エラーを自律修正。14の標的のうち9つで有望な創薬候補を得ました。ゲノミクスでは1週間以上自律稼働し、138種の動物の単一細胞データを集約し独自のMLモデルを学習。Scienceに最近掲載されたモデルを100分の1のサイズで上回ったといいます。サイバーセキュリティ用ベンチマークExploitBenchでは78%で、Mythos Preview(69%)・Opus 4.8(40%)を更新しました。
価格と安全装置
料金は入力10ドル/出力50ドル(100万トークンあたり)で、Opus 4.8(入力5ドル/出力25ドル)の倍。Claude.aiでは2倍消費としてカウントされます。危険な要求はAI分類器がOpus 4.8へ自動ルーティングする仕組みで、95%以上のセッションには影響しないとされる一方、Anthropic自身も「フィルタが過剰で無害な要求を遮ることがある」と認めています。Mythos系には30日間のデータ保持も導入されました。
💼 事業会社視点:これは自社にどう効くか
日本の事業会社にとって最も効くのは「コーディングの単価が崩れる」事実です。Stripeの5か月→数日、5000万行Rubyの2か月→1日という事例は、SIer・受託開発の見積り構造を直撃します。受託開発・SES企業は工数積算ベースの提案から、AI前提の固定価格・成果報酬への切替を急ぐ必要があります。月内には、ベンダーロックされている既存システムの「移行見積り」をFable 5に通させ、提示工数の妥当性を経営層が直接検証すべきフェーズです。
SaaS企業の経営層は、価格設計の再構築が論点。出力50ドル/MTokは従来比2倍超で、AI機能を従量転嫁する設計でないとマージンが消えます。「2倍消費」のClaude.aiルールから逆算し、自社プランも実トークン課金へ寄せる判断が必要です。
製薬・素材・金融の役員は、Mythos 5の自律研究が現実解になった点を重く見るべきです。社内R&Dの定型分析をAI担当に再配分する組織設計と、Project Glasswing相当のガバナンス整備を並行で進める時期に来ています。