2月28日,据金融时报报道,中国人工智能公司DeepSeek计划于下周发布最新一代大语言模型V4,这是该公司自2025年1月发布R1推理模型以来的首次重大更新。V4将是一款具备图像、视频与文本生成能力的多模态模型,DeepSeek已与中国本土AI芯片厂商华为和寒武纪展开合作,对V4进行定制优化以适配双方最新一代芯片产品,从而在算力层面形成更紧密的协同,被视为中国科技企业加速摆脱对英伟达高端AI芯片依赖的又一信号。
此次发布计划在中国一年一度的全国"两会"召开前夕推出,今年"两会"将于3月4日开幕,这一高规格政治会议为该公司提供了重要的曝光窗口,或将进一步巩固其"国家级AI冠军"形象。多名知情人士预计,DeepSeek专门针对国产AI芯片优化V4,将有助于提振本土芯片的市场需求,并加速在模型推理阶段向华为、寒武纪等中国厂商转移,降低对英伟达和AMD芯片的依赖。不过,在模型训练领域,英伟达仍占据主导地位,其GPU仍是行业标准。
DeepSeek预计将在下周发布V4的同时附上一份篇幅较短的技术说明文档,重点介绍关键改进点,并在大约一个月后推出更为详尽的技术报告。与此同时,围绕知识产权与模型"蒸馏"的争议也在升温,本周早些时候美国AI公司Anthropic指控DeepSeek及另外两家中国AI实验室对其模型实施所谓"蒸馏攻击",即利用更强大模型的输出对小型模型进行训练,使后者在不直接使用同等级算力资源的情况下接近前者性能。

来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。