何が起きたか
2019年創業のAI推論スタートアップBasetenが、$13Bの評価額で$1.5Bの新規調達を最終調整中だとWall Street Journalが報じました。リード投資家はSpark Capital、Sands Capital、Altimeter Capital、Wellington Managementの4社による共同主導とされています。
注目すべきは評価額の上昇スピードです。同社は5カ月前に$5Bの評価額で$300MのシリーズEを実施したばかり。その9カ月前には$150MのシリーズDを完了しています。半年弱で評価額が160%跳ね上がった計算です。
スプリットプライス構造という「演出」
WSJによれば、今回のラウンドは投資家ごとに異なる価格で株式を発行する「スプリットプライス方式」とされ、$13Bで入る投資家と$11Bで入る投資家が混在します。これは見出し評価額を高く見せつつリード投資家の見栄えを良くする手法で、純粋な市場評価ではなく「演出された価格」が含まれている点は読み解きが必要です。
なぜ推論レイヤーにマネーが集中するのか
メディアThe Next Waveはこの状況を「推論ゴールドラッシュ(inference gold rush)」と表現しました。学習(training)ではなく、ユーザーがプロンプトを送った後にモデルが応答を返す「推論(inference)」の処理層に、VCマネーが流れ込んでいます。
Basetenの強みは、リクエストごとに最適なモデル—特に性能が十分で安価なオープンソース代替—へ動的にルーティングし、速度を保ちつつコストを抑える点にあります。基盤モデルのコモディティ化が進むほど、「どのモデルにどう振るか」という推論オーケストレーション層の価値が高まる構図です。
💼 事業会社視点:これは自社にどう効くか
日本の事業会社にとって、このニュースは「AIコストの主戦場が学習から推論に移った」というシグナルです。
生成AI機能をプロダクトに組み込んだ国内SaaSやEC事業者は、ユーザー増加に比例して推論コストが膨らむ「成功すると赤字」の構造に直面しつつあります。OpenAIやAnthropicのフラッグシップモデルを叩き続ける設計のままでは、粗利は確実に削られます。役員・事業責任者が今すぐ着手すべきは、(1)用途別にモデルを使い分ける「ルーティング設計」を内製するか外部基盤に委ねるかの判断、(2)オープンソースモデル(Llama系・Qwen系など)への部分置換による単価圧縮の検証、の2点です。
また受託開発企業にとっては、顧客のAI導入PoCが本番稼働フェーズに移る中で、「推論コスト設計」が単独の提案商材になり得ます。Basetenのような海外基盤の代理販売や、国内GPUクラウドとの組み合わせ提案は、SIerの新たな収益源として検討に値します。$13Bという評価額は過熱の証拠でもありますが、「推論最適化はコスト戦略の中核」という市場の合意は本物です。