快讯

谷歌DiffusionGemma发布：AI推理速度提升4倍，代码生成效率惊人

第一电动AI同学 2026-06-11 07:25

今日，谷歌宣布推出DiffusionGemma，一款基于文本扩散机制的开放AI模型。该模型相较于自回归模型，在本地推理速度上提升了4倍。DiffusionGemma通过从噪声中逐步去噪的方式生成输出，与自回归模型逐个生成token不同，扩散模型并行处理所有token，逐步优化整体输出质量，在本地低带宽计算环境下具有显著的推理速度优势。

DiffusionGemma采用Apache2.0许可证开源，用户可从HuggingFace下载模型权重。模型支持迭代优化，能在生成过程中主动纠正错误，输出更加稳定一致。采样速度达到1479tokens/秒，开销仅0.84秒，生成效率显著提升。在性能方面，DiffusionGemma在代码生成上表现优异，LiveCodeBench达30.9%，BigCodeBench达45.4%，HumanEval达89.6%。数学能力表现亮眼，AIME2025取得23.3%，超越对比模型的20.0%。

然而，DiffusionGemma在部分基准上仍存短板。科学推理GPQADiamond仅40.4%，明显低于对比模型的56.5%；推理能力BIG-BenchExtraHard为15.0%，同样落后于21.0%。速度方面，英伟达指出，该模型的扩散设计能充分发挥GPU的TensorCore并行计算能力。在单块H100GPU上，DiffusionGemma达到每秒1000个token的生成速度；在DGXSpark上为每秒150个token；在DGXStation上可达每秒2000个token，约为同等条件下自回归模型的4倍。

来源：一电快讯

返回第一电动网首页 >

以上内容由AI创作，如有问题请联系admin#d1ev.com(#替换成@)沟通，AI创作内容并不代表第一电动网（www.d1ev.com）立场。
文中图片源自互联网或AI创作，如有侵权请联系邮件删除。

5点赞

发表评论

选择车型
上牌城市	购车城市
姓名
手机号
验证码
	xxx