DiffusionGemma

初现 · 出现于 2026-06-10 · 22 天前 · 最近核对 2026-06-12

DiffusionGemma 是 Google DeepMind 的一个 26B 开权重语言大模型，采用离散扩散 (discrete diffusion) 生成文字，跳过了传统的逐 token 顺序预测。具体做法：对整个 256-token 块同时去噪，一次出 256 个 token，把 GPU 并行算力吃满，正好契合 GPU 的硬件强项。

2026 年 6 月 10 日以 Apache 2.0 协议发布，基于 Gemma 4 MoE 架构，推理时只激活 3.8B 参数，量化后 18 GB 显存就能装下，单张 H100 上跑到 1,000+ tok/s，是第一个来自一线 AI 实验室的重量级开源 dLLM。

把它想成印刷机：普通大模型像打字机，一个 token 一个 token 往外敲；DiffusionGemma 一次压印整整 256 个。

搜索热度

峰值 ~2.6K/月

更新于 2026-07-02

~2.6K/月 ~1.3K/月 0

2026-06-03 2026-06-18 2026-07-02

词的生命周期

萌芽

0–7 天
初现 ← 当前

8–30 天
验证中

31–90 天
上升

91–180 天
成熟

180 天以上

为什么是现在火？

TL;DR

Google DeepMind 在 2026 年 6 月 10 日发布了 DiffusionGemma，是大型 AI 实验室中第一个开权重的离散扩散大模型。NVIDIA 同日跟进，RTX 和 DGX 平台首日支持。单张 H100 跑到 1,000+ tok/s，Apache 2.0 协议，给本地优先、延迟敏感的 AI 应用打开了一个自回归模型填不上的设计空间。

5 个因素在推动它走红，右滑 →

Google Blog

DiffusionGemma：文本生成速度提升 4 倍

26B MoE，3.8B 激活参数，H100 上 1,000+ tok/s，Apache 2.0。以并行去噪替代逐 token 生成，一次处理 256 个 token。

Jun 10, 2026

vLLM Blog

DiffusionGemma：首个原生支持 vLLM 的 dLLM

H200 跑出 1,288 tok/s（约为自回归的 6 倍），复用了 speculative decoding 基础设施，新增 DiffusionSampler 类。

Jun 10, 2026

NVIDIA Blog

RTX 和 DGX 平台首日支持

DGX Station 最高 2,000 tok/s；RTX 消费级 GPU 支持；DGX Spark：150 tok/s。Hugging Face Transformers、vLLM、Unsloth 发布当天均已支持。

Jun 10, 2026

Y Hacker News

DiffusionGemma：文本生成速度提升 4 倍

Jun 10, 2026 323 points · 87 comments

Google Developers Blog

DiffusionGemma：开发者指南

通过 Hackable Diffusion (JAX) 微调；vLLM serve 命令；微调后 Sudoku 成功率从 0% 升到 80%，验证了 diffusion 的任务专项能力。

Jun 11, 2026

前景

未来 6 个月的信号走势和商业化节奏。

信号高

营收适中

一线大厂发布的第一个开权重 dLLM；NVIDIA day-1 支持加上 Apache 2.0 协议，生态跟进会很快。

风险 · 输出质量目前还跑不赢标准的 Gemma 4；这个差距迟迟不缩小的话，在非速度敏感场景的普及就会受限。

类比 · gemma-4 · mtp · mercury

变现时间线

现在

开放权重，NVIDIA API 免费

Apache 2.0 权重已在 HuggingFace 上线；NVIDIA 在 build.nvidia.com 提供免费推理接口。
3-6 个月

速度敏感型产品入场

内联编辑器、本地代码补全工具和实时聊天应用，这些基于 dLLM 速度优势的产品开始进入市场。
6-12 个月

质量差距决定天花板

与 Gemma 4 的质量差距缩小，普及面才会扩大；差距持续存在就只能在速度敏感和边缘推理场景站稳。

“DiffusionGemma” 的竞争与机会

三个启发式信号，来自追踪到的搜索词、这个词的变现卡片，还有它的相关词。仅供参考，未经核实。

内容缺口

2 个追踪的搜索词

主要是通用 (2)

2 个仅 Suggest 的长尾词，长尾有机会

变现潜力

0% 商业意图搜索词

2 个变现路径

以信息型为主，尚未商业化

上手难度

中

阶段：初现 — 入场还早，来得及

4 / 13 默认 TLD 已被占用 · 最早注册 diffusiongemma.com (2026-06-10)

7 个相关词已发布

启发式 · 信号：追踪的搜索词、变现卡片、相关词

“DiffusionGemma” 能做的点子

把这个词做成文章、网站、产品、帖子、邮件、视频或课程，随便挑一张卡片就能开干。

文章

DiffusionGemma vs Gemma 4：快 4 倍换来的质量折扣，什么时候值得接受？

覆盖「diffusiongemma vs」和「diffusion vs autoregressive」等搜索词。带基准对比表的常青对比指南，目标读者是在选本地 LLM 方案的开发者。

文章

10 分钟内用 vLLM 在本地跑起 DiffusionGemma

瞄准「diffusiongemma local setup」和「diffusion llm vllm」搜索词。附 Docker 命令和示例输出的分步教程，开发者上手最快的路径。

文章

什么是 diffusion LLM？面向开发者的 DiffusionGemma 解析

填补概念空白：搜到这个词的读者多半没有 discrete diffusion 背景。靠「what is diffusion llm」等搜索词持续带来流量。

产品

基于 DiffusionGemma 的内联 AI 代码编辑器，消费级 GPU 跑出 700+ tok/s 整行补全

双向注意力机制支持 infilling（中间填充，不只是从左往右续写）。瞄准 VS Code 插件市场，在延迟层面和 Copilot 的自回归方案有明显差异。

产品

实时 diffusion 对话界面，看 token 从噪声中逐渐成型

可视化去噪动画（token 从噪声状态逐渐收敛）是 dLLM 独有的效果，本身就是很好的演示 hook。适合做开源 UI 套件或面向本地模型玩家的 SaaS。

视频

「DiffusionGemma vs Gemma 4：同一提示词，同一 GPU，并排跑」RTX 5090 速度演示

顺序生成和并行生成的直观对比。diffusion「填充」动画天然适合视频，文字难以还原，传播性强。

简报

Diffusion LLMs Weekly：跟踪 Mercury、DiffusionGemma 和正在成形的 dLLM 圈子

dLLM 这个品类刚刚起步，一份精选周报现在进场还来得及成为这个领域的标杆。以 DiffusionGemma 发布为起点，逐步覆盖研究进展和微调实践。

帖子 HN / r/LocalLLM

DiffusionGemma 是第一个真正能在消费级硬件上跑的开权重 dLLM

Mercury 跑得快，但闭源、只有云端。DiffusionGemma 是 Apache 2.0，18 GB 显存就能跑，RTX 5090 上能到 700 tok/s，diffusion 阵营等的就是这一刻。

帖子 LinkedIn / Newsletter

Google 把新的推理路线开源了，builder 现在能用它做什么

DiffusionGemma 发布两天后，.com、.org、.xyz 就被抢注完了。速度敏感的产品，先动者优势就在眼前。

帖子 YouTube / Tech media

我用 DiffusionGemma 替换本地自回归大模型用了一周，最后留下来的是什么

快 4 倍，差 15%。用了七天，写代码、写作、聊天都试过了，现在很清楚哪些任务这个折扣值得接受。

大家在搜什么

来自 Google Suggest 和 Trends 的长尾词。热度和竞争度是估算，仅供参考，未经核实。内容类型由搜索词的写法推断。

关键词

竞争度

内容类型

diffusion gemma

低

通用

diffusiongemma huggingface

极低

通用

更新于 2026-07-02 · 来源：Google Trends、Google Suggest · 竞争度为估算

“DiffusionGemma” 的搜索结果

现在搜索的人会看到的页面：自然结果在上，有人投广告就显示在那。广告多少是实时的商业化信号。

常见问题

什么是 DiffusionGemma？

DiffusionGemma 为什么现在火？

DiffusionGemma 是什么时候出现的？

约于 2026-06-10 公开出现（截至 2026-07-02 约 22 天前）。EarlyTerms 最早于 2026-06-12 记录到信号。

来源

这份报告引用的一手链接，点开任意一条都能自己核对。

搜索热度

为什么是现在火？

前景

“DiffusionGemma” 的竞争与机会

“DiffusionGemma” 能做的点子

大家在搜什么

“DiffusionGemma” 的搜索结果

常见问题

相关词

来源

完整访问是付费功能