今日,小米宣布推出XiaomiOneVL,这是一个一步式潜空间语言视觉推理框架,标志着
自动驾驶技术的重大进步。XiaomiOneVL在业内首次实现了VLA、世界模型、潜空间推理等多个技术路线的统一,不仅提升了推理速度和精度,还在精度上超越了显式CoT,在速度上与“仅答案”预测的潜空间CoT方案对齐。
XiaomiOneVL通过“语言推理+视觉未来预测”的双重监督,将可解释性与世界模型的未来预测能力统一到latent reasoning中,为自动驾驶大模型探索出新的精度—效率平衡路径。该框架的核心洞察在于,自动驾驶不仅要理解当前场景,更要理解时空因果信息,以预判未来并做出高质量决策。XiaomiOneVL提出了三项关键技术:让模型用“内部语言”思考、学会预测未来画面、并将推理过程压缩到一步完成。
小米官方表示,XiaomiOneVL的模型权重和训练、推理代码已全面开源,邀请全球开发者和研究人员共同参与,探索自动驾驶大模型的无限可能。这一举措有望推动自动驾驶技术的进步和迭代,为未来自动驾驶的发展提供强有力的技术支持。
来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。