何が起きたか
VentureBeatが従業員100人以上の企業のテックリーダー132名を対象に行ったQ2 2026 Pulse Researchの結果が公開されました。回答企業の48%は500〜9,999人規模、35%が1万人超、業種はテクノロジー42%・金融20%が中心です。
失敗の主因は「脳」ではなく「背骨」
調査で最も注目すべきは、エージェント失敗の主因をモデル推論(Brain)に帰した回答は17%にとどまり、37%が「Spine問題」=ステートレスな実行基盤が長時間・多段の処理に耐えられないことを挙げた点です。47%は標準的な連携層(MCPなど)の欠如=Integration/Governance Gapを最大の摩擦と回答しました。回答者の言葉を借りれば「モデルは十分に賢いが、ステートレスなインフラが長尺の処理を扱うには脆すぎる」。
スプリント工数を食い潰す「配管作業」
Finding 2では、24%が「Reliability Crisis」(スプリント能力の50%超をプラミングに消費)、27%が「Complexity Trap」(25〜50%消費)、26%が「Maintenance Tax」(10〜25%、概ね週1日のデバッグ)に該当。エンジニアリング時間に実質的な配管コストが乗っている企業は計77%に達しました。
失敗の現れ方とベンダーの観測性負担
失敗モードの内訳は、トークンコストと運用負荷が事業価値を超える「ROI Ceiling」が29%、初期の推論ズレが連鎖する「Hallucination Propagation」が24%、サイレントなAPIタイムアウトや状態喪失でエージェントが無言で止まる「Ghost Failures」が20%、コンテナ再起動などでコンテキストを失う「State Amnesia」が17%。
観測性コストが最も高いプラットフォームには42%がMicrosoft(GitHub Copilot Workspaces / Agent Framework)、30%がOpenAI(Codex / Agents SDK)、16%がGoogle、12%がAnthropicを挙げました。マーケティングと信頼性の乖離(ハイプ・ギャップ)でもMicrosoftが45%で最大、OpenAIが22%と続きます。Red HatのBrian Gracelyが3月のVentureBeatイベントで述べた「単一クラウドのツール群の中だけで制御系を組むのは『檻を借りているようなもの』」という指摘が、定量データで裏付けられた格好です。
💼 事業会社視点:これは自社にどう効くか
日本の事業責任者が読むべき含意
国内SIerや受託開発企業、社内DX部門の責任者にとって、この調査は「AIエージェント案件のリスクの所在地」を再定義するものです。提案や見積もりの議論はGPT-5かClaude 4.7かといったモデル選定に偏りがちですが、本番障害の主因はそこではなく、状態管理・リトライ・観測性といった「背骨」の設計にあります。
具体的には3点。第一に、エンタープライズ案件で約半数のスプリント能力が配管に消える前提でPoCの工数見積もりを引き直すべきです。第二に、Microsoft一辺倒のスタック(Copilot Workspaces + Azure)で組む構想は、観測性コスト最大・ハイプギャップ最大という二重のリスクを抱えます。Azure採用の経営判断は維持しつつも、エージェント実行基盤・トレース層は別プロダクトで切り出す「檻を借りない」設計を要求すべきです。第三に、SaaS事業者は自社プロダクトに「State Amnesia」と「Ghost Failures」を起こさない永続化レイヤーを実装することが、エージェント機能の課金化の前提条件になります。役員は「どのモデルを使うか」より「失敗した時に何が見えるか」を稟議の判断軸に据え替えるべきです。