5月27日,面壁智能携手清华大学和OpenBMB开源社区共同发布了ForgeTrain,这是全球首个完全由AI编写、无需人类代码介入的生产级大模型训练框架。面壁智能利用ForgeTrain在华为昇腾芯片上完成了新一代“小钢炮”MiniCPM5-1B模型的预训练,并在评测中显示,该模型在全球同尺寸模型中综合性能领先,位列AA榜单2B规模以下Top1。这一成果标志着从AI编写框架到在国产芯片上运行再到训出领先AI模型的完整闭环已成功打通。
ForgeTrain框架完全开源,官方同步发布了框架代码和AgentHarness工具链,包括评测标准、测试规约和智能体编排方案。这使得任何团队都能够复现从逐比特对齐到性能反超的全过程。ForgeTrain的开源性质为AI领域的发展提供了新的工具和可能性,有助于推动技术进步和创新。


来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。