Google 推出 DiffusionGemma 開放實驗模型,文字生成速度提升 4 倍



Google DeepMind 於 2026 年 6 月 10 日正式發布 DiffusionGemma,這是 Google 第一款採用「擴散技術」(Diffusion)進行文字生成的開放實驗模型。與傳統自迴歸(Autoregressive)模型逐詞從左到右生成的方式不同,DiffusionGemma 可以一次生成整段文字,大幅提升推理速度。

DiffusionGemma 建立在 Gemma 4 系列與 Gemini Diffusion 研究之上,採用 26B Mixture-of-Experts(MoE)架構,推論時僅激活約 3.8B 參數。
其最大特色在於使用「擴散」機制進行文字生成:

  • 模型會先建立一個充滿隨機佔位符的「文字畫布」。
  • 透過多次迭代優化,逐步修正文字內容。
  • 具備雙向注意力(Bidirectional Attention),能同時考量整段文字的上下文。
  • 支援自我修正機制,可在生成過程中即時修復錯誤。
這種方式特別適合需要非線性處理的任務,例如程式碼補全、即時編輯、數學圖形推理等。

根據 Google 公布的數據,DiffusionGemma 在 GPU 上的推理速度最高可比傳統自迴歸模型快 4 倍。量化後的版本可在高階消費級 GPU(如 RTX 5090)上運行,VRAM 需求約 18GB。
Google 表示,該模型特別適合以下場景:

  • 本地端互動式應用
  • 即時程式碼生成與編輯
  • 低延遲的單用戶工作流程
不過,Google 也坦言,DiffusionGemma 在部分基準測試中的輸出品質仍略低於標準 Gemma 4 模型,因此建議在需要最高品質的應用中,仍優先使用傳統 Gemma 4。

DiffusionGemma 已正式開放,採用 Apache 2.0 授權,使用者可自由使用、修改與商業化。目前可在以下平台取得:

  • Hugging Face:google/diffusiongemma-26B-A4B-it
  • Google Cloud Model Garden
  • NVIDIA NIM
  • vLLM
  • llama.cpp(即將支援)
傳統大型語言模型大多採用自迴歸架構,一次只能生成一個 token,這在單一 GPU 的本地環境中效率較低。DiffusionGemma 則借鏡圖像生成領域的擴散模型概念,將文字生成轉為「平行處理整段文字」的模式。 Google 研究團隊指出,這種架構在互動式 coding、即時編輯,以及需要雙向上下文理解的任務上,具有明顯優勢。


相關文章:

《隨機鸚鵡的危險》論文與 Timnit Gebru 被 Google 解雇事件  [6/10/2026]
Google 推出 Agentic RAG 框架 提升企業 AI 回答準確度  [6/7/2026]
Google 正式釋出 Gemma 4 12B-it 多模態模型適合本地部署  [6/4/2026]
Google 鼓勵開發者善用 AI 加速 PostgreSQL 貢獻  [5/30/2026]
Google I/O 2026:Chrome 推出 15 項更新,邁向代理式網路時代  [5/20/2026]
[「擇法善思林之蘭室藏津」的緣起]
鄭麗文海外酸「選舉只能用奧步」 民進黨反嗆:先自問為何胡作非為!
5旬男大腸癌復發、轉移 跨科7小時切除重建助康復
世足》開踢就有熱潮了!南韓炸雞外送訂單暴增 韓媒:還以為沒興趣
永和仁愛公園「貞愛城堡」地墊及優化工程完工 小朋友遊玩更安心
新北觀光工廠5大主題活動起跑 巴士一日遊、主題禮包6/29起線上搶購
中職》青棒潛力股旅外潮 洪總一句話道破現實
中職》「不會輕易放棄!」 普悠瑪倖存者王羽飛首次挑戰職棒
斥資7.2億三單位進駐!霧峰區聯合行政中心9月啟用
中職》中信兄弟發展「類三軍」 新領隊彭政閔談規劃方向
端午連假國旅訂房率僅近5成! 「1離島」破8成居冠
端午吃粽 台南「粽子地圖」引領品嘗傳統特色粽
岡山大火燒出累犯業者的「營運成本」台灣前進陣線揭罰133.6萬、得標逾3.2億
日準航艦「加賀號」啟航執行3個月印太部署 可起降F-35B引發關注
中職》和哥哥李勛傑超神似 李立威想和他在職棒場上較勁
美伊達成協議!台股飆逾千點、新台幣勁揚1角重返31.5字頭
[擇法善思林之蘭室藏津]