12月18日,中科曙光在江苏昆山举办的光合组织2025人工智能创新大会上发布了scaleX万卡超集群,是国产万卡级AI集群系统首次以真机形式亮相。该系统是面向万亿参数大模型、科学智能等复杂任务场景的大规模智能算力基础设施方案。scaleX万卡超集群在超节点架构、高速互连网络、存储性能优化、系统管理调度等方面实现了多项创新突破,部分技术与能力已超越海外同类产品的2027年NVL576里程节点。
scaleX万卡超集群由16个曙光scaleX640超节点通过scaleFabric高速网络互连而成,可实现10240块AI加速卡部署,总算力规模超5EFlops。scaleX640超节点采用超高密度刀片、浸没相变液冷等技术,将单机柜算力密度提升20倍,PUE值低至1.04。此外,自主研发的scaleFabric网络基于国内首款400G类InfiniBand的原生RDMA网卡与交换芯片,实现400Gb/s超高带宽、低于1微秒端侧通信延迟,超节点间的通信性能达到业内领先水平。
scaleX万卡超集群通过“超级隧道”、AI数据加速等设计,实现从芯片级、系统级到应用级的三级数据传输协同优化,提升高通量AI推理时的响应速度与结果精准度,并可将AI加速卡资源利用率提高55%。同时,超集群数字孪生与智能调度技术实现故障定位、修复等全流程可视化智能管理,智能化运维平台可支撑集群长期可用性达99.99%;智能调度引擎可管理万级节点、服务十万级用户,支持每秒万级作业调度。该超集群可支持多品牌加速卡以及主流计算生态,并实现400+主流大模型、世界模型等适配优化,覆盖大模型训练、金融风控、地质能源勘探及科学智能等多元场景。

来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。