今日,
谷歌宣布推出DiffusionGemma,一款基于文本扩散机制的开放AI模型。该模型相较于自回归模型,在本地推理速度上提升了4倍。DiffusionGemma通过从噪声中逐步去噪的方式生成输出,与自回归模型逐个生成token不同,扩散模型并行处理所有token,逐步优化整体输出质量,在本地低带宽计算环境下具有显著的推理速度优势。
DiffusionGemma采用Apache2.0许可证开源,用户可从HuggingFace下载模型权重。模型支持迭代优化,能在生成过程中主动纠正错误,输出更加稳定一致。采样速度达到1479tokens/秒,开销仅0.84秒,生成效率显著提升。在性能方面,DiffusionGemma在代码生成上表现优异,LiveCodeBench达30.9%,BigCodeBench达45.4%,HumanEval达89.6%。数学能力表现亮眼,AIME2025取得23.3%,超越对比模型的20.0%。
然而,DiffusionGemma在部分基准上仍存短板。科学推理GPQADiamond仅40.4%,明显低于对比模型的56.5%;推理能力BIG-BenchExtraHard为15.0%,同样落后于21.0%。速度方面,英伟达指出,该模型的扩散设计能充分发挥GPU的TensorCore并行计算能力。在单块H100GPU上,DiffusionGemma达到每秒1000个token的生成速度;在DGXSpark上为每秒150个token;在DGXStation上可达每秒2000个token,约为同等条件下自回归模型的4倍。



来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。