今日,中昊芯英宣布推出新一代全自研高性能TPU AI专用芯片「须臾」,同时软硬件一体化智算底座「泰则2.0」也同步亮相。须臾芯片的单芯片混合精度浮点算力达到896TFLOPS,是上一代芯片「刹那」的3倍;8-bit推理算力高达1792TOPS,适配高并发推理场景。显存和芯片内部互联速率显著提升,支持超长上下文处理。单卡额定功耗为600W,相比传统算力芯片功耗降低50%,有助于低碳数据中心的建设。须臾芯片在IP核、指令集、底层算子加速库、整机系统软件等方面均实现自主研发,无海外核心技术依赖,满足政务、金融、电网等行业的安全合规要求。
「泰则2.0」作为高性能智算平台的标准最小计算单元,搭载两路高性能CPU处理器与8片高性能TPU处理单元,形成1台通用CPU服务器外接1台高性能TPU算力加速设备的物理形态。其算力达到7.168P混合精度,同等任务下整机能耗仅为传统GPU服务器的80%。平台在软件层面实现全主流AI框架兼容,原生支持PyTorch、vLLM、SGLang等开发工具,训练场景适配DeepSpeed、Megatron-LM分布式套件,并已完成Qwen全系列、DeepSeek、GLM、MiniMAX等数十款大语言、多模态模型的深度适配,便于开发者快速完成模型迁移。

来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。