GoogleがオープンソースのDiffusionGemmaを公開——256トークンを並列生成、H200で標準比6倍の速度を実現
Googleは今週、Gemma 4をバックボーンに構築した拡散原理ベースのテキスト生成モデル「DiffusionGemma」をApache 2.0ライセンスでオープンソース公開した。256トークンのブロックを並列に生成する新しいアーキテクチャにより、NVIDIA H200上で標準的な自己回帰モデルと比べて最大6倍の速度(毎秒1,288トークン)を達成している。
Googleは今週、Gemma 4をバックボーンに構築した拡散原理ベースのテキスト生成モデル「DiffusionGemma」をApache 2.0ライセンスでオープンソース公開した。256トークンのブロックを並列に生成する新しいアーキテクチャにより、NVIDIA H200上で標準的な自己回帰モデルと比べて最大6倍の速度(毎秒1,288トークン)を達成している。
Googleが2026年5月に試験公開した拡散型言語モデル「Gemini Diffusion」がオープンウェイトモデル「DiffusionGemma(google/diffusiongemma-26B-A4B-it)」としてApache 2ライセンスで正式リリースされ、NVIDIAがNIM Cloud APIを通じて無償提供を開始した。6月10日の検証では2,409トークンを4.4秒で生成し、500トークン/秒以上の実用的な速度が確認されている。
Googleは拡散プロセスによってテキストを生成する実験的オープンウェイトモデル「DiffusionGemma」を公開した。シングルGPU・シングルユーザー環境において従来の自己回帰型言語モデルと比べ最大4倍の速度でテキストを出力でき、H100では毎秒1,000トークンを実現する。