何が公開されたか
XiaomiのMiMo AIチームは2026年6月10日、ターミナル上で動くAIコーディングハーネス「MiMo Code V0.1.0」を公開しました。OpenCodeをフォークし、独自のメモリ層・ワークフロー・モデル接続を追加した構成で、GitHub上でMITライセンスとして提供されます。macOS/Linuxはcurl一発、Windowsはnpmで導入可能です。
設計の核は「メモリ」
最大の差別化点は、SQLite FTS5全文検索を使った4層のクロスセッション記憶です。プロジェクト記憶(MEMORY.md)、セッションのチェックポイント、走り書きメモ、タスク別の進捗ログを持ち、独立した「checkpoint-writer」サブエージェントがリアルタイムで更新します。コンテキストウィンドウが埋まっても、構造化されたチェックポイントから文脈を再構築できる仕組みです。
さらに/dreamコマンドが約7日ごとに過去セッションを重複排除して長期記憶に圧縮し、distill機能は繰り返しの作業パターンを自動化候補として抽出します。Xiaomiは「必要なのは圧縮ではなく、何をいつ書き込み・呼び戻すかを決める明示的な保存・検索機構だ」と説明しています。
ベンチマークと評価の読み方
Xiaomiの自社ベンチマークでは、MiMo Code + MiMo-V2.5-ProがClaude Code + Claude Sonnet 4.6に対し、SWE-bench Verifiedで82%対79%、SWE-bench Proで62%対55%、Terminal Bench 2で73%対69%と上回ったとしています。同じMiMo-V2.5-Proを両ハーネスで走らせた場合の差は約5ポイントで、ハーネス自体の寄与とされます。
ただし、Terminal-Bench 2.0の公式リーダーボードでは、OpenAIのCodex CLI(GPT-5.5)が82.2%、GPT-5.5公式発表では82.7%、SWE-Bench ProでGPT-5.5が58.6%と、別軸では他社が先行する数値もあります。XiaomiはCodexやGemini CLIとの直接比較は出していません。
注目すべきは人手評価です。576名の開発者が474の実プライベートリポジトリで行った二重盲検A/B評価では、200ステップ未満ではClaude Codeとほぼ五分、200ステップを超えると勝率が65%超に伸びたと報告されています。「ワンショットの問題解決能力しか測れていない」既存ベンチマークの限界を、長時間タスクで突く狙いが透けます。
価格・接続性・運用
MiMo-V2.5は入力$0.40/出力$2.00、V2.5-Proは256Kまで$1.00/$3.00。Claude Code側のMCPサーバー・カスタムスキル・API設定を自動インポートでき、DeepSeek、Kimi、GLMなどOpenAI互換APIにも接続できます。MiMo-V2.5-Proは「ハーネス意識(harness awareness)」を後訓練で組み込み、エージェント足場の中で自らメモリと文脈を管理するよう設計されています。
💼 事業会社視点:これは自社にどう効くか
事業責任者が見るべき論点
受託開発・SIerにとってのインパクト:MiMo CodeのMITライセンスとClaude Code設定の自動インポートは、社内エンジニア環境の「乗り換えコスト」を実質ゼロに近づけます。Claude Opus 4.8の$5/$25という単価で開発生産性ツールを月額予算化していた中堅SIerやSES事業者にとって、MiMo-V2.5-Proの$1/$3、しかも200ステップ超で勝率65%という主張は、PoC候補に乗せない理由がない水準です。1〜3名規模でAIコーディング検証ラインを立ち上げ、自社の主要言語スタックで内部ベンチを取るべきタイミングです。
国内SaaS・自社プロダクト企業:マイグレーション、レガシー解体、テスト整備のような「長時間・多ステップ」のタスクこそMiMoが優位を主張する領域です。ここは従来エンジニア工数で律速されていた経営課題でもあります。ただし中国系モデルである以上、ソースコードと顧客データの送信先・契約条項の整理は法務とセキュリティの事前合意が必須。OpenAI互換APIで国内/自社ホスト型に逃げる前提で評価設計するのが現実解です。
経営判断としての構図:Claudeか中国系か、の二者択一ではなく「ハーネスとモデルを切り離す」流れが本格化したと読むべきです。調達戦略は単一ベンダー固定からハーネス標準化+モデル切替可能へ舵を切る局面に入りました。