Google DeepMind、テキスト拡散の26B MoE開放モデル「DiffusionGemma」を公開

2026年6月11日

Google DeepMindを含むGoogle AIチームは、テキスト生成向けの実験的なオープンモデル「DiffusionGemma」を公開しました。
同モデルは通常の自己回帰デコードではなく、テキスト拡散により複数トークンを並列に生成します。
推論時に有効化するパラメータは3.8Bで、ベースはGemma 4の26B-A4Bアーキテクチャに拡散ヘッドを統合した構成です。
生成性能についてGoogleは、専用GPUで最大4倍の高速化をうたっており、NVIDIA H100単体で1000トークン/秒超、GeForce RTX 5090で700トークン/秒超としています。
量子化した場合は18GBのVRAMに収まるとされ、Apache 2.0ライセンスで提供されます。
一方で、標準のGemma 4より出力品質は低いとして、品質重視の本番用途にはGemma 4を推奨しています。
また、双方向アテンションによる自己修正を特徴としており、低信頼トークンを再ノイズして後続パスで置き換えられる仕組みです。
Googleはローカルでの低遅延なインタラクティブ利用や、インライン編集、長文解析、OCR、コード生成などの活用を想定しています。

参照元：2026/06/11 「Google AI Releases DiffusionGemma, a 26B MoE Open Model Using Text Diffusion for Up to 4x Faster Generation」 https://www.marktechpost.com/2026/06/10/google-ai-releases-diffusiongemma-a-26b-moe-open-model-using-text-diffusion-for-up-to-4x-faster-generation/