AIエージェントが本番で動かない真因とは?VentureBeat調査が示す「脳ではなく背骨」の問題

VentureBeatが2026年5月に実施したPulse Research(有効回答132名)によれば、企業のAIエージェント失敗の主因はモデル性能ではなくステートレスな実行基盤の脆さで、観測性コスト(Observability Tax)が最も重いと指摘されたのはMicrosoft(42%)でした。

何が起きたか

VentureBeatが従業員100人以上の企業のテックリーダー132名を対象に行ったQ2 2026 Pulse Researchの結果が公開されました。回答企業の48%は500〜9,999人規模、35%が1万人超、業種はテクノロジー42%・金融20%が中心です。

失敗の主因は「脳」ではなく「背骨」

調査で最も注目すべきは、エージェント失敗の主因をモデル推論(Brain)に帰した回答は17%にとどまり、37%が「Spine問題」=ステートレスな実行基盤が長時間・多段の処理に耐えられないことを挙げた点です。47%は標準的な連携層(MCPなど)の欠如=Integration/Governance Gapを最大の摩擦と回答しました。回答者の言葉を借りれば「モデルは十分に賢いが、ステートレスなインフラが長尺の処理を扱うには脆すぎる」。

スプリント工数を食い潰す「配管作業」

Finding 2では、24%が「Reliability Crisis」(スプリント能力の50%超をプラミングに消費)、27%が「Complexity Trap」(25〜50%消費)、26%が「Maintenance Tax」(10〜25%、概ね週1日のデバッグ)に該当。エンジニアリング時間に実質的な配管コストが乗っている企業は計77%に達しました。

失敗の現れ方とベンダーの観測性負担

失敗モードの内訳は、トークンコストと運用負荷が事業価値を超える「ROI Ceiling」が29%、初期の推論ズレが連鎖する「Hallucination Propagation」が24%、サイレントなAPIタイムアウトや状態喪失でエージェントが無言で止まる「Ghost Failures」が20%、コンテナ再起動などでコンテキストを失う「State Amnesia」が17%。

観測性コストが最も高いプラットフォームには42%がMicrosoft(GitHub Copilot Workspaces / Agent Framework)、30%がOpenAI(Codex / Agents SDK)、16%がGoogle、12%がAnthropicを挙げました。マーケティングと信頼性の乖離(ハイプ・ギャップ)でもMicrosoftが45%で最大、OpenAIが22%と続きます。Red HatのBrian Gracelyが3月のVentureBeatイベントで述べた「単一クラウドのツール群の中だけで制御系を組むのは『檻を借りているようなもの』」という指摘が、定量データで裏付けられた格好です。

💼 事業会社視点：これは自社にどう効くか

日本の事業責任者が読むべき含意

国内SIerや受託開発企業、社内DX部門の責任者にとって、この調査は「AIエージェント案件のリスクの所在地」を再定義するものです。提案や見積もりの議論はGPT-5かClaude 4.7かといったモデル選定に偏りがちですが、本番障害の主因はそこではなく、状態管理・リトライ・観測性といった「背骨」の設計にあります。

具体的には3点。第一に、エンタープライズ案件で約半数のスプリント能力が配管に消える前提でPoCの工数見積もりを引き直すべきです。第二に、Microsoft一辺倒のスタック(Copilot Workspaces + Azure)で組む構想は、観測性コスト最大・ハイプギャップ最大という二重のリスクを抱えます。Azure採用の経営判断は維持しつつも、エージェント実行基盤・トレース層は別プロダクトで切り出す「檻を借りない」設計を要求すべきです。第三に、SaaS事業者は自社プロダクトに「State Amnesia」と「Ghost Failures」を起こさない永続化レイヤーを実装することが、エージェント機能の課金化の前提条件になります。役員は「どのモデルを使うか」より「失敗した時に何が見えるか」を稟議の判断軸に据え替えるべきです。

よくある質問

なぜモデル性能ではなく「インフラ」が主因とされるのですか?

VentureBeatの調査では、10ステップを超える長尺ワークフローでの失敗が、コンテナ再起動による状態喪失(17%)やサイレントなAPIタイムアウト(20%)など、ステートレスな実行基盤側で発生していると回答されたためです。

Microsoftが観測性コスト1位とされた根拠は何ですか?

GitHub Copilot WorkspacesやMicrosoft Agent Frameworkを名指しで「最も観測性コストが高い」と回答した割合が42%(OpenAI 30%、Google 16%、Anthropic 12%)で最多だったためです。

MCPとは何で、なぜ重要なのですか?

MCPはエージェントと外部システムを標準的につなぐ連携層で、調査では47%が「こうした標準的な接続組織の欠如」を最大の摩擦と回答しており、ガバナンスと統合の前提インフラと位置づけられています。

本記事は VentureBeat の報道を元に、事実に基づき独自に再構成したものです。

AIエージェントが本番で動かない真因とは?VentureBeat調査が示す「脳ではなく背骨」の問題

何が起きたか

失敗の主因は「脳」ではなく「背骨」

スプリント工数を食い潰す「配管作業」

失敗の現れ方とベンダーの観測性負担

💼 事業会社視点：これは自社にどう効くか

日本の事業責任者が読むべき含意

よくある質問

関連記事

AIエージェントの「インフラ層」とは？BAND・Conifers・Raindrop・Arcade・Omiliaの5社から見える次の投資対象

AIエージェントの「検索コスト」が経営課題に——Nimble Web Search Agentsが示すトークン51%削減の意味

AIエージェントのガバナンスとは？導入が先行し統制が後追いする5層と、企業の6～7割が1年内に乗り換える理由