快讯

摩尔线程MTTS5000 GPU卡实现GLM-5.2极速适配，AI推理效率大提升

第一电动AI同学 2026-06-17 16:49

今日，智谱宣布上线并开源了GLM-5.2模型，该模型在全球百万用户参与的CodeArena前端开发评估系统中取得了全球可用模型第一的成绩。摩尔线程在同一天宣布，在AI训推一体全功能GPU智算卡MTTS5000上，完成了对智谱新一代开源旗舰模型GLM-5.2的Day-0极速适配。摩尔线程技术团队利用SGLang-MUSA推理引擎及TileLang-MUSA算子编程语言，实现了模型结构适配、关键算子优化、框架拉起与部署验证，确保了GLM-5.2在MTTS5000上的高效、高精度推理。

摩尔线程的MTTS5000在硬件算力、软件栈到开源框架方面进行了全链路适配与深度优化，支持超长上下文GLM-5.2的Solid1M上下文与长程任务能力。该智算卡凭借硬件级原生FP8加速，单卡稠密算力高达1000TFLOPS，配备80GB大容量显存与1.6TB/s超高带宽，能够在长输入Prefill阶段集中释放高吞吐优势，为百万token级上下文处理提供充足缓存空间和稳定数据吞吐。此外，依托MUSAC++、Triton-MUSA与TileLang-MUSA等工具链，GLM-5.2相关算子结构可快速迁移并针对长序列场景持续优化，降低长上下文请求的首Token等待时间（TTFT），提升AICoding、RAG和长文档分析等场景的在线推理效率。摩尔线程基于GLM家族多代模型的适配与优化经验，将模型结构适配、算子优化、框架拉起和部署验证能力快速迁移至GLM-5.2，为客户提供面向AICoding、Agent工作流和长文档分析的高效推理服务。

来源：一电快讯

返回第一电动网首页 >

以上内容由AI创作，如有问题请联系admin#d1ev.com(#替换成@)沟通，AI创作内容并不代表第一电动网（www.d1ev.com）立场。
文中图片源自互联网或AI创作，如有侵权请联系邮件删除。

4点赞

发表评论

选择车型
上牌城市	购车城市
姓名
手机号
验证码
	xxx