盖世汽车讯 据外媒报道,英伟达(NVIDIA)发布专为物理AI打造的开放世界基础模型NVIDIA Cosmos™ 3。该模型基于突破性的“混合Transformer”架构构建,将视觉推理、世界生成与动作预测整合于单一系统中。
图片来源:英伟达
Cosmos 3是全球首个完全开放的“全能模型”(omnimodel),能够以领先的物理精度原生理解并生成文本、图像、视频、环境音效及动作,从而将物理AI的训练与评估周期从数月缩短至数日。
NVIDIA还推出了“NVIDIA Cosmos 联盟”(NVIDIA Cosmos Coalition),这是一个汇聚了世界模型构建者与AI开发者的全球协作平台——成员包括Agile Robots、Black Forest Labs、Generalist、LTX、Runway和Skild AI——旨在携手推动下一代世界模型的发展。
NVIDIA创始人兼首席执行官黄仁勋表示:“得益于多模态推理、语言、视觉以及世界模型领域的突破性进展,物理AI的‘大爆炸’时刻已近在咫尺。Cosmos 3系列开放式前沿全能模型,将赋予开发者跨越代际的能力提升,助其打造出能够在物理世界中进行感知、推理、规划与行动的机器人、自动驾驶车辆以及视觉AI系统。”
来源:第一电动网
作者:盖世汽车
本文地址:https://www.d1ev.com/news/shichang/301761
以上内容转载自盖世汽车,目的在于传播更多信息,如有侵仅请联系admin#d1ev.com(#替换成@)删除,转载内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网,如有侵权请联系admin#d1ev.com(#替换成@)删除。