何が起きているか

AI支出の現場が、わずか半年で「使え、急げ」から「止血せよ」に反転しました。Uberは2026年のAIコーディング予算を4月までに使い切り、Microsoftは一度配布したClaude Codeのライセンスを数カ月で取り消しました。Priceline社員はCursorの契約更新が4〜5倍の価格で戻ってきたと証言し、Faros AIのCEO Vitaly Gordonは、ある一人のエンジニアが1カ月で4万ドルのトークンを消費したCTOの事例を語っています。FinOps Foundationの J.R. Storment は「4〜5月、各社から『2026年度のトークン予算を3倍超過した』という悲鳴を聞き始めた」と話します。

なぜ予算が壊れたか

単価は下がっているのに総額は跳ね上がっています。理由は二つです。第一に、2025年初頭に各社が結んだ「使い放題型」サブスクリプションのもと、CEOが「最高のモデルを使え、コストは気にするな」と号令をかけたこと。第二に、11月に登場したClaude Opus 4.5、GPT-5.1、Gemini 3 Proが自律エージェントの実用性を一気に引き上げ、1タスクあたりの消費トークンを桁違いに増やしたことです。Jellyfishの調査では、AIをヘビーに使うエンジニアは生産性が約2倍になる一方、トークン消費は10倍。1人あたり消費量は9カ月で18.6倍に膨張しました。

「FinOpsのAI版」が走り出した

Linux Foundationは、クラウド支出を統制してきたFinOpsを手本に Tokenomics Foundation を立ち上げ、7月に正式発足します。クラウドのコスト追跡が月数億行の問題だったのに対し、トークンは月数兆行——既存の経費管理ツールでは扱えない規模です。Pay-iやPaidといった専業、Jellyfish・Waydev・Faros AIのエージェント監視、Ramp、Datadog、New Relic、そしてFinOps Xで新機能を出すとされるAWSまでが参入。Factoryはタスクごとに最適モデルを自動選択するルーターを投入し、Opusを呼んでも内部でSonnet/Haikuに振る「OpenRouter型最適化」が主流化しつつあります。Goldman Sachsは世界のトークン消費が2030年までに24倍になると予測しており、可視化と最適化は一過性の話ではありません。

💼 事業会社視点:これは自社にどう効くか

日本の事業会社にとって、これは「来期のAI予算を組み直せ」という警告です。特にSaaS・受託開発・社内開発を抱えるEC企業の経営者は、CursorやClaude Code、Copilotの「席数課金」感覚で経営判断していると、Pricelineと同じ4〜5倍の更新提示を食らいます。打ち手は三つあります。第一に、ユーザー別・チーム別のトークン上限を今すぐ設定すること。Pricelineが特定グループに上限を設けたのと同じ動きで、5億ドル請求の伝説を笑っている場合ではありません。第二に、ROI評価軸を「席数×単価」から「出荷した機能の事業価値÷トークン消費」に切り替えること。Jellyfishの Arcolano が指摘するように、最大のリターンはヘビーユーザーをさらに伸ばすことではなく、低使用層を中位に押し上げることから生まれます。受託開発各社はここを社内KPIに据えるべきです。第三に、調達側はモデルルーティング前提の契約交渉に移ること。Opus指定でもSonnet/Haikuで処理される領域が増える以上、ベンダー報告値と社内計測値の乖離(Pricelineも指摘)を監査できる体制が、来年度のコスト差を決めます。

関連リンク