AIトークンコスト爆発の正体——Uberが4月に2026年度予算を使い切った構造と、Tokenomics Foundation誕生の意味

Uberは2026年のAIコーディング予算を4月時点で使い切り、ある企業はClaudeで5億ドルの請求を受けたと報じられました。Linux Foundationは7月にTokenomics Foundationを正式発足させ、暴走するトークン支出を可視化・標準化する動きが本格化しています。

何が起きているか

AI支出の現場が、わずか半年で「使え、急げ」から「止血せよ」に反転しました。Uberは2026年のAIコーディング予算を4月までに使い切り、Microsoftは一度配布したClaude Codeのライセンスを数カ月で取り消しました。Priceline社員はCursorの契約更新が4〜5倍の価格で戻ってきたと証言し、Faros AIのCEO Vitaly Gordonは、ある一人のエンジニアが1カ月で4万ドルのトークンを消費したCTOの事例を語っています。FinOps Foundationの J.R. Storment は「4〜5月、各社から『2026年度のトークン予算を3倍超過した』という悲鳴を聞き始めた」と話します。

なぜ予算が壊れたか

単価は下がっているのに総額は跳ね上がっています。理由は二つです。第一に、2025年初頭に各社が結んだ「使い放題型」サブスクリプションのもと、CEOが「最高のモデルを使え、コストは気にするな」と号令をかけたこと。第二に、11月に登場したClaude Opus 4.5、GPT-5.1、Gemini 3 Proが自律エージェントの実用性を一気に引き上げ、1タスクあたりの消費トークンを桁違いに増やしたことです。Jellyfishの調査では、AIをヘビーに使うエンジニアは生産性が約2倍になる一方、トークン消費は10倍。1人あたり消費量は9カ月で18.6倍に膨張しました。

「FinOpsのAI版」が走り出した

Linux Foundationは、クラウド支出を統制してきたFinOpsを手本に Tokenomics Foundation を立ち上げ、7月に正式発足します。クラウドのコスト追跡が月数億行の問題だったのに対し、トークンは月数兆行——既存の経費管理ツールでは扱えない規模です。Pay-iやPaidといった専業、Jellyfish・Waydev・Faros AIのエージェント監視、Ramp、Datadog、New Relic、そしてFinOps Xで新機能を出すとされるAWSまでが参入。Factoryはタスクごとに最適モデルを自動選択するルーターを投入し、Opusを呼んでも内部でSonnet/Haikuに振る「OpenRouter型最適化」が主流化しつつあります。Goldman Sachsは世界のトークン消費が2030年までに24倍になると予測しており、可視化と最適化は一過性の話ではありません。

💼 事業会社視点：これは自社にどう効くか

日本の事業会社にとって、これは「来期のAI予算を組み直せ」という警告です。特にSaaS・受託開発・社内開発を抱えるEC企業の経営者は、CursorやClaude Code、Copilotの「席数課金」感覚で経営判断していると、Pricelineと同じ4〜5倍の更新提示を食らいます。打ち手は三つあります。第一に、ユーザー別・チーム別のトークン上限を今すぐ設定すること。Pricelineが特定グループに上限を設けたのと同じ動きで、5億ドル請求の伝説を笑っている場合ではありません。第二に、ROI評価軸を「席数×単価」から「出荷した機能の事業価値÷トークン消費」に切り替えること。Jellyfishの Arcolano が指摘するように、最大のリターンはヘビーユーザーをさらに伸ばすことではなく、低使用層を中位に押し上げることから生まれます。受託開発各社はここを社内KPIに据えるべきです。第三に、調達側はモデルルーティング前提の契約交渉に移ること。Opus指定でもSonnet/Haikuで処理される領域が増える以上、ベンダー報告値と社内計測値の乖離(Pricelineも指摘)を監査できる体制が、来年度のコスト差を決めます。

よくある質問

なぜトークン単価が下がっているのに総コストが急増しているのですか?

自律エージェントの普及と、11月に登場したClaude Opus 4.5、GPT-5.1、Gemini 3 Proが1タスクあたりの消費量を大幅に増やしたためです。Goldman Sachsは世界のトークン使用量が2030年までに24倍になると予測しています。

Tokenomics Foundationとは何で、何を標準化しようとしていますか?

Linux Foundationが主導し、クラウド支出のFinOpsを手本にした新標準化団体です。canonicalな定義、オープン標準、cost-per-intelligenceやtokens-per-wattといった新指標の策定を進めており、7月に正式発足、FinOps Xで追加メンバーが発表される予定です。

トークンコストの追跡はなぜクラウドコスト管理より難しいのですか?

FinOps FoundationのJ.R. Stormentによれば、クラウドコスト追跡が月「数億行」の問題なのに対し、トークンコスト追跡は月「数兆行」のデータ問題で、既存のスプレッドシートや簡易ツールでは扱えず、ツール・仕様・会計システムの根本的な再設計が必要です。

本記事は TechCrunch の報道を元に、事実に基づき独自に再構成したものです。

AIトークンコスト爆発の正体——Uberが4月に2026年度予算を使い切った構造と、Tokenomics Foundation誕生の意味

何が起きているか

なぜ予算が壊れたか

「FinOpsのAI版」が走り出した

💼 事業会社視点：これは自社にどう効くか

関連リンク

よくある質問

関連記事

Claude Code Artifactsとは？AnthropicがCLIから共有可能な対話型ダッシュボードを生成する新機能を解説

SpaceXがCursorを6兆円超で買収、AIコーディング市場の勢力図はどう変わるか

トークン課金で予算が溶ける──KPMG調査が示すAIコスト可視化の遅れと、CFOが今四半期に直面する現実