DeLMとは?Stanfordが示す「中央司令官なし」マルチエージェントの仕組みとコスト半減の根拠

Stanfordの研究チームが、中央オーケストレータを置かずにAIエージェント同士を直接連携させる新フレームワーク「DeLM(decentralized language model)」を発表。SWE-bench Verifiedで最強ベースラインを10.5%上回り、タスクあたりコストを約50%削減したと報告しています。

何が発表されたのか

StanfordのYuzhen Mao氏、Azalia Mirhoseini氏らの研究チームが、マルチエージェントを「中央集権型」から「分散協調型」に置き換えるフレームワークDeLMを提示しました。中核は、検証済みの要約(gist)を貯める共有コンテキストと、各エージェントが自律的に取りに行くタスクキューの2つです。

従来型は、メインエージェントがタスクを分解してサブエージェントに割り当て、結果を待ち、統合し、また指示を出す——という往復構造でした。研究者らは、サブタスクが増えるほどこの中央が「通信と統合のボトルネック」と化し、情報の希釈・欠落・歪みが起きると指摘しています。

DeLMの仕組み

DeLMでは初期化後、並列エージェントが同時に走り、結果を圧縮・検証したうえで検証済みのgistだけが共有コンテキストに書き込まれます。失敗した仮説も「ここは行き止まりだ」という情報として残り、後続エージェントは同じ穴を掘り直さずに済みます。検証済み制約は即座に共有状態としてバインドされる仕組みです。

特徴的なのがunfoldable(展開可能)な共有状態です。普段は短いgistだけを参照し、必要なときだけ詳細サマリや生の証拠まで展開できる「粗→細」のオプトイン設計で、コンテキスト窓の肥大化とコストを抑えつつ精度を担保します。研究者らは「フルトレースを共有すれば、各ワーカーが長大なコマンド履歴や失敗編集を読まされ、協調そのものが長文ボトルネックになる」と述べています。

なぜ重要か

結果は具体的です。ソフトウェア工学のベンチマークSWE-bench VerifiedでDeLMは最強ベースラインを10.5%上回り、タスクあたりコストを約50%削減。長文推論のLongBench-v2 Multi-Doc QAでは、GPT-5.4、Claude Sonnet、Gemini Flash、DeepSeek-V4-Proを含む4つのモデルファミリーで最高精度を記録しました。

これは「マルチエージェントには必ず中央司令官が要る」という前提への反証であり、特に並列デバッグや複数文書を跨ぐ調査タスクで効くアーキテクチャだと言えます。

💼 事業会社視点：これは自社にどう効くか

日本企業のCTO・事業責任者が直視すべきは、マルチエージェントのコスト構造が変わりつつある点です。

SaaS事業者やAI機能を組み込むSIerにとって、これまでの「親エージェントが全部仕切る」構成は推論コストとレイテンシが線形以上に膨らみ、価格転嫁できずに粗利を圧迫してきました。DeLMが示したコスト約50%削減は、同じ単価でも提供機能の幅を倍近くにできることを意味します。

受託開発・SES企業にとってはより切実です。SWE-bench Verifiedで10.5%精度向上というのは、AIによるコード修正・デバッグ支援を「補助」から「主戦力」に近づける数字です。エンジニア一人あたりの捌けるチケット数が変われば、見積もりと契約形態(時間単価→成果報酬)を根本的に見直す圧力になります。

EC・コマース系の事業責任者は、商品問い合わせ対応や在庫×需要予測のような「複数文書・複数システムを横断する判断」に効く点に注目すべきです。中央集権型で諦めていた並列化と失敗の共有が現実解になります。今期中に自社のエージェント設計が中央集権型かを棚卸しし、PoCの設計図を引き直す時期です。

よくある質問

DeLMは具体的にどんな用途に向いていますか?

研究者らはソフトウェア工学のテスト時スケーリング(並列デバッグなど)、長文推論、複数文書にまたがるQ&Aに特に有効としています。

なぜコストが約50%下がるのですか?

中央エージェントによる往復統合をなくし、検証済みのgistのみを共有することで、各エージェントが長大なトレースを読み込まずに済むためです。詳細は必要時のみ「展開」して参照する設計です。

失敗した試行はどう扱われますか?

失敗仮説も共有コンテキストに記録され、後続エージェントは同じ探索を繰り返さず、より有望な修正方向に資源を振り向けられます。

本記事は VentureBeat の報道を元に、事実に基づき独自に再構成したものです。

DeLMとは?Stanfordが示す「中央司令官なし」マルチエージェントの仕組みとコスト半減の根拠

何が発表されたのか

DeLMの仕組み

なぜ重要か

💼 事業会社視点：これは自社にどう効くか

関連リンク

よくある質問

関連記事

目的駆動型対話とは？LLMチャットボットが多ターン会話で「迷子」になる構造的限界

MetaのForum・Sellerとは？LLMで「アプリ量産」に舵を切ったMetaの狙いを解説

AIエージェントの「信頼」はどう測るか？Vijilが説く実行時トラストと受託者責任