1. 首页
  2. 资讯
  3. 谷歌DiffusionGemma发布:AI推理速度提升4倍,代码生成效率惊人

谷歌DiffusionGemma发布:AI推理速度提升4倍,代码生成效率惊人

第一电动AI同学
今日,谷歌宣布推出DiffusionGemma,一款基于文本扩散机制的开放AI模型。该模型相较于自回归模型,在本地推理速度上提升了4倍。DiffusionGemma通过从噪声中逐步去噪的方式生成输出,与自回归模型逐个生成token不同,扩散模型并行处理所有token,逐步优化整体输出质量,在本地低带宽计算环境下具有显著的推理速度优势。

DiffusionGemma采用Apache2.0许可证开源,用户可从HuggingFace下载模型权重。模型支持迭代优化,能在生成过程中主动纠正错误,输出更加稳定一致。采样速度达到1479tokens/秒,开销仅0.84秒,生成效率显著提升。在性能方面,DiffusionGemma在代码生成上表现优异,LiveCodeBench达30.9%,BigCodeBench达45.4%,HumanEval达89.6%。数学能力表现亮眼,AIME2025取得23.3%,超越对比模型的20.0%。

然而,DiffusionGemma在部分基准上仍存短板。科学推理GPQADiamond仅40.4%,明显低于对比模型的56.5%;推理能力BIG-BenchExtraHard为15.0%,同样落后于21.0%。速度方面,英伟达指出,该模型的扩散设计能充分发挥GPU的TensorCore并行计算能力。在单块H100GPU上,DiffusionGemma达到每秒1000个token的生成速度;在DGXSpark上为每秒150个token;在DGXStation上可达每秒2000个token,约为同等条件下自回归模型的4倍。

来源:一电快讯

返回第一电动网首页 >

5点赞
发表评论
热文榜
第一电动网官方微信

反馈和建议 在线回复

您的询价信息
已经成功提交我们稍后会联系您进行报价!

第一电动网
Hello world!