谷歌发布 DiffusionGemma 开源模型：基于文本扩散机制，本地推理速度飙升 4 倍

6 月 11 日，谷歌正式发布公告，推出基于文本扩散机制的全新开放 AI 模型——DiffusionGemma。与当前主流的自回归模型（如 GPT、Gemini）不同，该模型在本地推理速度上实现了 4 倍的提升。

当前主流大模型采用的自回归架构按从左到右顺序逐个生成 Token，虽在云端批处理中效率较高，但在本地推理时易受内存带宽限制，造成计算资源浪费。DiffusionGemma 引入的扩散机制则另辟蹊径，通过从噪声中逐步去噪的方式并行处理所有 Token，并在生成过程中不断优化整体输出质量。这种机制在本地低带宽计算环境下展现出了显著的推理速度优势。

开源与质量： DiffusionGemma 以 Apache 2.0 许可证在 Hugging Face 开源。其能力与 Gemma 4 相当，但推理效率大幅跃升。得益于扩散架构，该模型支持迭代优化，能在生成时主动纠错，输出更稳定一致。其采样速度高达 1479 tokens/秒，初始开销仅 0.84 秒。

性能表现：

代码生成： LiveCodeBench 达 30.9%，BigCodeBench 达 45.4%，HumanEval 达 89.6%，与 Gemini 2.0 Flash-Lite 互有胜负。

数学推理：表现亮眼，在 AIME 2025 基准中取得 23.3%，超越对比模型的 20.0%，凸显了扩散架构在推理任务上的潜力。

存在短板：科学推理（GPQA Diamond）和复杂推理（BIG-Bench Extra Hard）得分分别为 40.4% 和 15.0%，明显低于对比模型的 56.5% 和 21.0%。

硬件加速：英伟达在官方博文中指出，DiffusionGemma 的扩散设计能充分发挥其 GPU Tensor Core 的并行计算能力。在单块 H100 GPU 上生成速度达 1000 tokens/秒；在 DGX Station 上高达 2000 tokens/秒；在 DGX Spark 上则为 150 tokens/秒，整体速度约为同等条件下自回归模型的 4 倍。

如果您喜欢本站，点击这儿不花一分钱捐赠本站

这些信息可能会帮助到你：下载帮助 | 报毒说明 | 进站必看

修改版本安卓软件，加群提示为修改者自留，非本站信息，注意鉴别

发表回复

简单至上. 2026年7月26日

求求大家了，我听说果壳运行经费不足了。希望大家不要过滤广告。把果核剥壳的网站列入去广告白名单。毕竟他们运行不易啊。而且果核剥壳网站也并没有侵入式广告，不过滤广告也不会影响大家的。拜托了~

评论于 Google Chrome v150.0.7871.187 便携增强版
Eric 2026年7月26日

和时间关系不大，npp做的就是好，不论是界面的优化还是菜单的逻辑都是一样的，我用过vscode edit plus notepad2、3、4，UltraEdit等(包括VIM)后面发现要么功能太多，要么过于简陋，你要说一个原因，就是习惯，

评论于 Notepad - - (文本编辑器) v3.8.2 官方版
stanleu996 2026年7月26日

这个版本如何？可以了吗？

评论于万兴PDF(PDFExpert) v12.1.26.4340 特别版
流星 2026年7月26日

怼的挺过瘾的

评论于 Chromium v152.0.7970.0 绿色版
iyinyin8 2026年7月25日

桌面端是用的electron吗？

评论于电子阅读工具，GoRead软件体验
破碎狼魂 2026年7月25日

云盘下载速度怎么样

评论于迅雷17 v25.0.82.156 绿色精简版
闻道沐心 2026年7月25日

挺搞笑的，买个手机要护着不让骂，买个车要护着不让骂，玩个游戏要护着不让骂，如今，一个出生也要护着不让骂了，叹为观止

评论于 Notepad - - (文本编辑器) v3.8.2 官方版
a543 2026年7月25日

输入法？

评论于 Microsoft Edge v150.0.4078.96 离线安装包
56408656 2026年7月24日

最新版每次打开网站都要重新登录

评论于 360安全浏览器 v16.1.6088.64 优化便携版
Sumire 2026年7月24日

搞笑了是不，你这种滚刀肉不为了赢回我干什么呢？你不想长脑子没关系，反正给社区做贡献不缺你一个

评论于 Notepad - - (文本编辑器) v3.8.2 官方版

谷歌发布 DiffusionGemma 开源模型：基于文本扩散机制，本地推理速度飙升 4 倍 - 果核剥壳

相关推荐

发表回复