3月11日,英伟达公司宣布推出Nemotron3Super开源大模型,这是其迄今为止最强大的开源权重AI模型。Nemotron3Super模型拥有1200亿参数,采用混合专家(MoE)架构,专为大规模运行复杂智能体系统设计。该模型结合了先进的推理能力,能够为自主智能体高精度地完成任务。行业巨头如Perplexity、Palantir和西门子已将其应用于搜索、软件开发、电信和半导体设计等核心工作流中。
Nemotron3Super模型配备了100万Token的上下文窗口,使智能体能够将完整的工作流状态保留在内存中,从而防止目标偏移,并大幅降低多步推理的成本。在架构与性能方面,该模型采用了混合专家(MoE)架构,将吞吐量提升了5倍,准确率比前代翻倍。模型引入了“潜在MoE(LatentMoE)”新技术,以单个专家的计算成本激活四个专家,并支持多Token预测,让推理速度提升3倍。
英伟达对该模型采取了高度开放的策略,官方不仅遵循宽松许可证开源了模型权重,还公布了完整的训练方法,包括超10万亿Token的数据集和评估配方。开发者目前可通过HuggingFace、各大云服务商获取该模型,并已被打包为NVIDIANIM微服务,支持无缝部署制本地数据中心和云端。


来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。