#DiffusionGemma の記事一覧(3)

GoogleがオープンソースのDiffusionGemmaを公開——256トークンを並列生成、H200で標準比6倍の速度を実現
2026-06-11 ・ VentureBeat

GoogleがオープンソースのDiffusionGemmaを公開——256トークンを並列生成、H200で標準比6倍の速度を実現

Googleは今週、Gemma 4をバックボーンに構築した拡散原理ベースのテキスト生成モデル「DiffusionGemma」をApache 2.0ライセンスでオープンソース公開した。256トークンのブロックを並列に生成する新しいアーキテクチャにより、NVIDIA H200上で標準的な自己回帰モデルと比べて最大6倍の速度(毎秒1,288トークン)を達成している。

GoogleのDiffusionGemma、NVIDIAが無料APIで公開——500トークン/秒超の推論速度を実証
2026-06-10 ・ Simon Willison

GoogleのDiffusionGemma、NVIDIAが無料APIで公開——500トークン/秒超の推論速度を実証

Googleが2026年5月に試験公開した拡散型言語モデル「Gemini Diffusion」がオープンウェイトモデル「DiffusionGemma(google/diffusiongemma-26B-A4B-it)」としてApache 2ライセンスで正式リリースされ、NVIDIAがNIM Cloud APIを通じて無償提供を開始した。6月10日の検証では2,409トークンを4.4秒で生成し、500トークン/秒以上の実用的な速度が確認されている。

GoogleがDiffusionGemmaを公開——拡散プロセスで最大4倍高速なテキスト生成、シングルGPUで動作
2026-06-10 ・ The Decoder

GoogleがDiffusionGemmaを公開——拡散プロセスで最大4倍高速なテキスト生成、シングルGPUで動作

Googleは拡散プロセスによってテキストを生成する実験的オープンウェイトモデル「DiffusionGemma」を公開した。シングルGPU・シングルユーザー環境において従来の自己回帰型言語モデルと比べ最大4倍の速度でテキストを出力でき、H100では毎秒1,000トークンを実現する。

← タグ一覧へ