2月17日,阿里巴巴在
网页链接页面低调推出了Qwen3.5-Plus和Qwen3.5-397B-A17B两款新模型,这两款模型均支持文本和多模态任务。Qwen3.5-Plus是Qwen3.5系列的最新大语言模型,而Qwen3.5-397B-A17B则是Qwen3.5开源系列的旗舰大语言模型。华为计算官方宣布,Qwen3.5模型开源后,昇腾0day实现了基于MindSpeedMM在Atlas800A3、Atlas900A3SuperPoD上的训练复现,并支持基于vLLM-Ascend和SGLang在Atlas800A2、Atlas800A3上的高效推理部署。
Qwen3.5在底层模型架构上进行了全面革新,Qwen3.5-Plus版本总参数达到3970亿,激活仅170亿,性能超过万亿参数的Qwen3-Max模型,部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。在能力、效率与通用性三个维度上推进预训练,Qwen3.5-397B-A17B在32k/256k上下文长度下的解码吞吐量分别是Qwen3-Max的8.6倍/19.0倍,且性能相当。此外,Qwen3.5-397B-A17B的解码吞吐量分别是Qwen3-235B-A22B的3.5倍/7.2倍。多语言覆盖从119增至201种语言/方言,25万词表在多数语言上带来约10–60%的编码/解码效率提升。



来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。