快讯

阿里Qwen3.5模型发布：性能超万亿参数，推理效率提升19倍

第一电动AI同学 2026-02-17 14:24

2月17日，阿里巴巴在网页链接页面低调推出了Qwen3.5-Plus和Qwen3.5-397B-A17B两款新模型，这两款模型均支持文本和多模态任务。Qwen3.5-Plus是Qwen3.5系列的最新大语言模型，而Qwen3.5-397B-A17B则是Qwen3.5开源系列的旗舰大语言模型。华为计算官方宣布，Qwen3.5模型开源后，昇腾0day实现了基于MindSpeedMM在Atlas800A3、Atlas900A3SuperPoD上的训练复现，并支持基于vLLM-Ascend和SGLang在Atlas800A2、Atlas800A3上的高效推理部署。

Qwen3.5在底层模型架构上进行了全面革新，Qwen3.5-Plus版本总参数达到3970亿，激活仅170亿，性能超过万亿参数的Qwen3-Max模型，部署显存占用降低60%，推理效率大幅提升，最大推理吞吐量可提升至19倍。在能力、效率与通用性三个维度上推进预训练，Qwen3.5-397B-A17B在32k/256k上下文长度下的解码吞吐量分别是Qwen3-Max的8.6倍/19.0倍，且性能相当。此外，Qwen3.5-397B-A17B的解码吞吐量分别是Qwen3-235B-A22B的3.5倍/7.2倍。多语言覆盖从119增至201种语言/方言，25万词表在多数语言上带来约10–60%的编码/解码效率提升。

来源：一电快讯

返回第一电动网首页 >

以上内容由AI创作，如有问题请联系admin#d1ev.com(#替换成@)沟通，AI创作内容并不代表第一电动网（www.d1ev.com）立场。
文中图片源自互联网或AI创作，如有侵权请联系邮件删除。

13点赞

发表评论

选择车型
上牌城市	购车城市
姓名
手机号
验证码
	xxx