#NVIDIA の記事一覧(2)

GoogleのDiffusionGemma、NVIDIAが無料APIで公開——500トークン/秒超の推論速度を実証
2026-06-10 ・ Simon Willison

GoogleのDiffusionGemma、NVIDIAが無料APIで公開——500トークン/秒超の推論速度を実証

Googleが2026年5月に試験公開した拡散型言語モデル「Gemini Diffusion」がオープンウェイトモデル「DiffusionGemma(google/diffusiongemma-26B-A4B-it)」としてApache 2ライセンスで正式リリースされ、NVIDIAがNIM Cloud APIを通じて無償提供を開始した。6月10日の検証では2,409トークンを4.4秒で生成し、500トークン/秒以上の実用的な速度が確認されている。

← タグ一覧へ