EarlyTerms

DiffusionGemma

初现 · 出现于 · 22 天前 · 最近核对

DiffusionGemma 是 Google DeepMind 的一个 26B 开权重语言大模型,采用离散扩散 (discrete diffusion) 生成文字,跳过了传统的逐 token 顺序预测。具体做法:对整个 256-token 块同时去噪,一次出 256 个 token,把 GPU 并行算力吃满,正好契合 GPU 的硬件强项。

2026 年 6 月 10 日以 Apache 2.0 协议发布,基于 Gemma 4 MoE 架构,推理时只激活 3.8B 参数,量化后 18 GB 显存就能装下,单张 H100 上跑到 1,000+ tok/s,是第一个来自一线 AI 实验室的重量级开源 dLLM。

把它想成印刷机:普通大模型像打字机,一个 token 一个 token 往外敲;DiffusionGemma 一次压印整整 256 个。

搜索热度

峰值 ~2.6K/月
更新于 2026-07-02
~2.6K/月 ~1.3K/月 0
2026-06-03 2026-06-18 2026-07-02
词的生命周期
  1. 萌芽
    0–7 天
  2. 初现 ← 当前
    8–30 天
  3. 验证中
    31–90 天
  4. 上升
    91–180 天
  5. 成熟
    180 天以上

为什么是现在火?

TL;DR

Google DeepMind 在 2026 年 6 月 10 日发布了 DiffusionGemma,是大型 AI 实验室中第一个开权重的离散扩散大模型。NVIDIA 同日跟进,RTX 和 DGX 平台首日支持。单张 H100 跑到 1,000+ tok/s,Apache 2.0 协议,给本地优先、延迟敏感的 AI 应用打开了一个自回归模型填不上的设计空间。

5 个因素在推动它走红,右滑 →

前景

未来 6 个月的信号走势和商业化节奏。

信号
营收 适中

一线大厂发布的第一个开权重 dLLM;NVIDIA day-1 支持加上 Apache 2.0 协议,生态跟进会很快。

风险 · 输出质量目前还跑不赢标准的 Gemma 4;这个差距迟迟不缩小的话,在非速度敏感场景的普及就会受限。

类比 · gemma-4 · mtp · mercury

变现时间线
  1. 现在
    开放权重,NVIDIA API 免费

    Apache 2.0 权重已在 HuggingFace 上线;NVIDIA 在 build.nvidia.com 提供免费推理接口。

  2. 3-6 个月
    速度敏感型产品入场

    内联编辑器、本地代码补全工具和实时聊天应用,这些基于 dLLM 速度优势的产品开始进入市场。

  3. 6-12 个月
    质量差距决定天花板

    与 Gemma 4 的质量差距缩小,普及面才会扩大;差距持续存在就只能在速度敏感和边缘推理场景站稳。

“DiffusionGemma” 的竞争与机会

三个启发式信号,来自追踪到的搜索词、这个词的变现卡片,还有它的相关词。仅供参考,未经核实。

内容缺口
2 个追踪的搜索词
主要是 通用 (2)
2 个仅 Suggest 的长尾词,长尾有机会
变现潜力
0% 商业意图搜索词
2 个变现路径
以信息型为主,尚未商业化
上手难度
阶段: 初现 — 入场还早,来得及
4 / 13 默认 TLD 已被占用 · 最早注册 diffusiongemma.com (2026-06-10)
7 个相关词已发布
启发式 · 信号:追踪的搜索词、变现卡片、相关词

“DiffusionGemma” 能做的点子

把这个词做成文章、网站、产品、帖子、邮件、视频或课程,随便挑一张卡片就能开干。

文章
DiffusionGemma vs Gemma 4:快 4 倍换来的质量折扣,什么时候值得接受?

覆盖「diffusiongemma vs」和「diffusion vs autoregressive」等搜索词。带基准对比表的常青对比指南,目标读者是在选本地 LLM 方案的开发者。

文章
10 分钟内用 vLLM 在本地跑起 DiffusionGemma

瞄准「diffusiongemma local setup」和「diffusion llm vllm」搜索词。附 Docker 命令和示例输出的分步教程,开发者上手最快的路径。

文章
什么是 diffusion LLM?面向开发者的 DiffusionGemma 解析

填补概念空白:搜到这个词的读者多半没有 discrete diffusion 背景。靠「what is diffusion llm」等搜索词持续带来流量。

产品
基于 DiffusionGemma 的内联 AI 代码编辑器,消费级 GPU 跑出 700+ tok/s 整行补全

双向注意力机制支持 infilling(中间填充,不只是从左往右续写)。瞄准 VS Code 插件市场,在延迟层面和 Copilot 的自回归方案有明显差异。

产品
实时 diffusion 对话界面,看 token 从噪声中逐渐成型

可视化去噪动画(token 从噪声状态逐渐收敛)是 dLLM 独有的效果,本身就是很好的演示 hook。适合做开源 UI 套件或面向本地模型玩家的 SaaS。

视频
「DiffusionGemma vs Gemma 4:同一提示词,同一 GPU,并排跑」RTX 5090 速度演示

顺序生成和并行生成的直观对比。diffusion「填充」动画天然适合视频,文字难以还原,传播性强。

简报
Diffusion LLMs Weekly:跟踪 Mercury、DiffusionGemma 和正在成形的 dLLM 圈子

dLLM 这个品类刚刚起步,一份精选周报现在进场还来得及成为这个领域的标杆。以 DiffusionGemma 发布为起点,逐步覆盖研究进展和微调实践。

帖子 HN / r/LocalLLM
DiffusionGemma 是第一个真正能在消费级硬件上跑的开权重 dLLM

Mercury 跑得快,但闭源、只有云端。DiffusionGemma 是 Apache 2.0,18 GB 显存就能跑,RTX 5090 上能到 700 tok/s,diffusion 阵营等的就是这一刻。

帖子 LinkedIn / Newsletter
Google 把新的推理路线开源了,builder 现在能用它做什么

DiffusionGemma 发布两天后,.com、.org、.xyz 就被抢注完了。速度敏感的产品,先动者优势就在眼前。

帖子 YouTube / Tech media
我用 DiffusionGemma 替换本地自回归大模型用了一周,最后留下来的是什么

快 4 倍,差 15%。用了七天,写代码、写作、聊天都试过了,现在很清楚哪些任务这个折扣值得接受。

大家在搜什么

来自 Google Suggest 和 Trends 的长尾词。热度和竞争度是估算,仅供参考,未经核实。内容类型由搜索词的写法推断。

关键词
竞争度
内容类型
diffusion gemma
通用
diffusiongemma huggingface
极低
通用
更新于 2026-07-02 · 来源:Google Trends、Google Suggest · 竞争度为估算

“DiffusionGemma” 的搜索结果

现在搜索的人会看到的页面:自然结果在上,有人投广告就显示在那。广告多少是实时的商业化信号。

常见问题

什么是 DiffusionGemma?

DiffusionGemma 是 Google DeepMind 的一个 26B 开权重语言大模型,采用离散扩散 (discrete diffusion) 生成文字,跳过了传统的逐 token 顺序预测。具体做法:对整个 256-token 块同时去噪,一次出 256 个 token,把 GPU 并行算力吃满,正好契合 GPU 的硬件强项。

DiffusionGemma 为什么现在火?

Google DeepMind 在 2026 年 6 月 10 日发布了 DiffusionGemma,是大型 AI 实验室中第一个开权重的离散扩散大模型。NVIDIA 同日跟进,RTX 和 DGX 平台首日支持。单张 H100 跑到 1,000+ tok/s,Apache 2.0 协议,给本地优先、延迟敏感的 AI 应用打开了一个自回归模型填不上的设计空间。

DiffusionGemma 是什么时候出现的?

约于 2026-06-10 公开出现(截至 2026-07-02 约 22 天前)。EarlyTerms 最早于 2026-06-12 记录到信号。

相关词

同一领域里的其他词:别名、子类、竞品,以及值得接着看的邻近词。

继续探索
还提到
  • 别名 dLLM
  • 属于 discrete diffusion LLM·local AI inference
  • 竞品 Mercury·Inception Labs Mercury

来源

这份报告引用的一手链接,点开任意一条都能自己核对。

  1. 01 DiffusionGemma:文本生成速度提升 4 倍 — Google Blog blog.google
  2. 02 DiffusionGemma 模型概览 — Google AI for Developers ai.google.dev
  3. 03 DiffusionGemma:开发者指南 — Google Developers Blog developers.googleblog.com
  4. 04 DiffusionGemma:首个原生支持 vLLM 的 dLLM — vLLM Blog vllm.ai
  5. 05 NVIDIA 首日支持 DiffusionGemma,覆盖 RTX 和 DGX — NVIDIA Blog blogs.nvidia.com
  6. 06 DiffusionGemma:文本生成速度提升 4 倍 — Hacker News 讨论 (323 分) news.ycombinator.com
  7. 07 DiffusionGemma — Google DeepMind 模型页 deepmind.google