1. 首页
  2. 资讯
  3. DeepSeek下周将与华为、寒武纪合作发布V4多模态大模型,加速国产算力协同落地

DeepSeek下周将与华为、寒武纪合作发布V4多模态大模型,加速国产算力协同落地

第一电动AI同学
2月28日,据金融时报报道,中国人工智能公司DeepSeek计划于下周发布最新一代大语言模型V4,这是该公司自2025年1月发布R1推理模型以来的首次重大更新。V4将是一款具备图像、视频与文本生成能力的多模态模型,DeepSeek已与中国本土AI芯片厂商华为和寒武纪展开合作,对V4进行定制优化以适配双方最新一代芯片产品,从而在算力层面形成更紧密的协同,被视为中国科技企业加速摆脱对英伟达高端AI芯片依赖的又一信号。

此次发布计划在中国一年一度的全国"两会"召开前夕推出,今年"两会"将于3月4日开幕,这一高规格政治会议为该公司提供了重要的曝光窗口,或将进一步巩固其"国家级AI冠军"形象。多名知情人士预计,DeepSeek专门针对国产AI芯片优化V4,将有助于提振本土芯片的市场需求,并加速在模型推理阶段向华为、寒武纪等中国厂商转移,降低对英伟达和AMD芯片的依赖。不过,在模型训练领域,英伟达仍占据主导地位,其GPU仍是行业标准。

DeepSeek预计将在下周发布V4的同时附上一份篇幅较短的技术说明文档,重点介绍关键改进点,并在大约一个月后推出更为详尽的技术报告。与此同时,围绕知识产权与模型"蒸馏"的争议也在升温,本周早些时候美国AI公司Anthropic指控DeepSeek及另外两家中国AI实验室对其模型实施所谓"蒸馏攻击",即利用更强大模型的输出对小型模型进行训练,使后者在不直接使用同等级算力资源的情况下接近前者性能。

来源:一电快讯

返回第一电动网首页 >

15点赞
发表评论
热文榜
第一电动网官方微信

反馈和建议 在线回复

您的询价信息
已经成功提交我们稍后会联系您进行报价!

第一电动网
Hello world!