何が発表されたのか
StanfordのYuzhen Mao氏、Azalia Mirhoseini氏らの研究チームが、マルチエージェントを「中央集権型」から「分散協調型」に置き換えるフレームワークDeLMを提示しました。中核は、検証済みの要約(gist)を貯める共有コンテキストと、各エージェントが自律的に取りに行くタスクキューの2つです。
従来型は、メインエージェントがタスクを分解してサブエージェントに割り当て、結果を待ち、統合し、また指示を出す——という往復構造でした。研究者らは、サブタスクが増えるほどこの中央が「通信と統合のボトルネック」と化し、情報の希釈・欠落・歪みが起きると指摘しています。
DeLMの仕組み
DeLMでは初期化後、並列エージェントが同時に走り、結果を圧縮・検証したうえで検証済みのgistだけが共有コンテキストに書き込まれます。失敗した仮説も「ここは行き止まりだ」という情報として残り、後続エージェントは同じ穴を掘り直さずに済みます。検証済み制約は即座に共有状態としてバインドされる仕組みです。
特徴的なのがunfoldable(展開可能)な共有状態です。普段は短いgistだけを参照し、必要なときだけ詳細サマリや生の証拠まで展開できる「粗→細」のオプトイン設計で、コンテキスト窓の肥大化とコストを抑えつつ精度を担保します。研究者らは「フルトレースを共有すれば、各ワーカーが長大なコマンド履歴や失敗編集を読まされ、協調そのものが長文ボトルネックになる」と述べています。
なぜ重要か
結果は具体的です。ソフトウェア工学のベンチマークSWE-bench VerifiedでDeLMは最強ベースラインを10.5%上回り、タスクあたりコストを約50%削減。長文推論のLongBench-v2 Multi-Doc QAでは、GPT-5.4、Claude Sonnet、Gemini Flash、DeepSeek-V4-Proを含む4つのモデルファミリーで最高精度を記録しました。
これは「マルチエージェントには必ず中央司令官が要る」という前提への反証であり、特に並列デバッグや複数文書を跨ぐ調査タスクで効くアーキテクチャだと言えます。
💼 事業会社視点:これは自社にどう効くか
日本企業のCTO・事業責任者が直視すべきは、マルチエージェントのコスト構造が変わりつつある点です。
SaaS事業者やAI機能を組み込むSIerにとって、これまでの「親エージェントが全部仕切る」構成は推論コストとレイテンシが線形以上に膨らみ、価格転嫁できずに粗利を圧迫してきました。DeLMが示したコスト約50%削減は、同じ単価でも提供機能の幅を倍近くにできることを意味します。
受託開発・SES企業にとってはより切実です。SWE-bench Verifiedで10.5%精度向上というのは、AIによるコード修正・デバッグ支援を「補助」から「主戦力」に近づける数字です。エンジニア一人あたりの捌けるチケット数が変われば、見積もりと契約形態(時間単価→成果報酬)を根本的に見直す圧力になります。
EC・コマース系の事業責任者は、商品問い合わせ対応や在庫×需要予測のような「複数文書・複数システムを横断する判断」に効く点に注目すべきです。中央集権型で諦めていた並列化と失敗の共有が現実解になります。今期中に自社のエージェント設計が中央集権型かを棚卸しし、PoCの設計図を引き直す時期です。