何が起きたか

Z.aiは長時間の自律コーディングを想定した7530億パラメータのLLM「GLM-5.2」を即日公開しました。Hugging Faceと自社API、そしてClaude Code、Cline、Kilo Code、Crush、Factoryなど20以上のサードパーティ開発環境で利用可能です。コンテキストウィンドウは100万トークン、コアの重みは制約のないMITライセンスで配布され、企業はローカルやVM上でファインチューニングして動かせます。

ベンチマーク上の立ち位置

社内検証では、SWE-bench Proで62.1(GPT-5.5は58.6、前世代GLM-5.1は58.4)、FrontierSWEで74.4%(GPT-5.5の72.6%を上回りClaude Opus 4.8の75.1%に肉薄)、MCP-Atlasで77.0、Humanity’s Last Exam(ツール利用)で54.7と、コーディング系で主要プロプライエタリモデルと互角以上の数値が並びます。Terminal-Bench 2.1では81.0でClaude Opus 4.8(85.0)に届かないものの、Cline IDEは「オープンウェイトとして初の80%超え」と評価しています。クラウドソースのDesign ArenaではELO1360で首位を獲得しました。

技術的な工夫と価格

新アーキテクチャ「IndexShare」は4層のスパースアテンション層で1つのインデクサを共有し、100万トークン時のFLOPsを2.9倍削減します。Multi-Token Prediction層の改良で投機的デコードの受理長も最大20%伸びました。API料金は入力100万トークン1.40ドル/出力4.40ドルで前世代と同水準。月12.60ドルからの「GLM Coding Plan」も用意され、X上の観測者Lisan al Gaibは「フロンティアラボはAPI価格で完全に詐欺をしている、90%以上の利益率だろう」と指摘しています。

米中の力学が反転する瞬間

今回のリリースは、トランプ政権が先週、外国籍ユーザーによるAnthropic「Claude Fable 5」の利用を禁じる輸出規制を出し、Anthropicがモデルをいったんオフラインにした直後に重なります。Z.aiはMITで「地域制限なし・国境のない技術アクセス」を明言しており、米国の囲い込みと対照的な動きとして位置づけられます。

💼 事業会社視点:これは自社にどう効くか

日本企業がいま直視すべき論点

受託開発・SIerにとって、GLM-5.2はクライアントの「自社環境内でAIコーディング支援を回したい」という要望に応える現実解になります。MITライセンスで重みを持ち帰れるため、金融・製造・公共のように外部API送信が制約される顧客にも提案できる構図が変わります。

SaaS事業者は価格比較表の組み直しが必要です。出力1Mトークンで4.40ドルというGLM-5.2の水準は、GPT-5.5(30ドル)やClaude Opus 4.8(25ドル)を前提に設計したコーディング系SaaSの粗利モデルを根本から揺さぶります。今期予算でClaude/OpenAIに張り切った企業ほど、来期に向けてマルチモデル切替の実装と、推論コストの転嫁先(ユーザー単価か機能差別化か)の再定義を急ぐべきです。

EC・事業会社の経営層には別の論点があります。米国の輸出規制でClaudeが一時オフラインになった事象は、海外プロプライエタリAPIに業務基盤を載せるリスクが「コスト」ではなく「事業継続」の問題に昇格したことを意味します。社内コード生成・カスタマーサポート自動化のような止まると痛い領域から、オープンウェイトを少なくとも代替経路として持つ二系統運用に切り替える判断を、CTOマターでなく取締役会の議題に上げる段階に来ています。

関連リンク