GoogleがオープンソースのDiffusionGemmaを公開——256トークンを並列生成、H200で標準比6倍の速度を実現
Googleは今週、Gemma 4をバックボーンに構築した拡散原理ベースのテキスト生成モデル「DiffusionGemma」をApache 2.0ライセンスでオープンソース公開した。256トークンのブロックを並列に生成する新しいアーキテクチャにより、NVIDIA H200上で標準的な自己回帰モデルと比べて最大6倍の速度(毎秒1,288トークン)を達成している。
Googleは今週、Gemma 4をバックボーンに構築した拡散原理ベースのテキスト生成モデル「DiffusionGemma」をApache 2.0ライセンスでオープンソース公開した。256トークンのブロックを並列に生成する新しいアーキテクチャにより、NVIDIA H200上で標準的な自己回帰モデルと比べて最大6倍の速度(毎秒1,288トークン)を達成している。
Google DeepMindは拡散(diffusion)ベースのアーキテクチャを採用したAIモデル「DiffusionGemma」を公開した。自己回帰モデルと比べてローカル環境での推論速度が約4倍速く、Apache 2.0ライセンスのもとHugging Faceからウェイトを無償取得できる。