继极越 01 的 1.3.1 版本官宣 OCC 占用网络上车后,紧随而至的 1.4.0 版本又更近一步地释放了极越这套以视觉为主的智驾能力。废话不多说,多说不废话,就让我们一起快速以图文形式体验下极越 1.4.0 版本更新了哪些内容吧。
介绍这篇章节前,需要提出一个灵魂问题:什么是占用网络?
在智能化浪潮的洗礼下,我们对于 BEV 有着初步的理解,而在 BEV+transformer 为车辆还原现实世界的基础上,特斯拉在 2022 年提出了有关自动驾驶车辆的一种基于视觉能力的全新算法——Occupancy Networks,直译为占用网络。
这套算法的目的在于解决在 3D 空间网络中所识别到的异型障碍物,原理则是通过“堆方盒子”的概念,也就是将现实世界中的物体用 3D 像素方块堆叠还原,从而表达出检测的物体。
极越 01 上 OCC 占用网络的具象化表现占用网络就像一个可以无限伸展的魔方,只需要知道前方是否有方块堆叠阻挡智驾系统规划的行车路线,不在乎它所检测的对象是什么,也不需要像以往矩形框识别标注般依赖训练,这意味着智驾研发团队能够解放这部分数据标注的精力,去进行更多的能力拓展。
而在 1.4.0 的极越 01 上,极越的智驾团队就为我们带来了这么一个小彩蛋——呼唤 SIMO 开启 OCC ,中控屏幕上的 SR 画面便会“咻”的一下进入 OCC 3D 地图网络当中,除了本车以外所有的地图信息都会进行方格化重绘,颇有种《我的世界》和乐高的结合感。
正在加载 视频播放器。 播放视频 播放 静音 当前时间 0:00 / 时长 0:00 加载完成: 0% 0:00 媒体流类型 直播 尝试直播,当前为延时播放 直播 剩余时间 - 0:00 1x 播放速度 节目段落 描述 字幕 音轨 Picture-in-Picture 全屏This is a modal window.
打开对话窗口。Escape键将取消并关闭对话窗口
文字 Color 白黑红绿蓝黄紫红青 Transparency不透明半透明 背景 Color 黑白红绿蓝黄紫红青 Transparency不透明半透明透明 窗口 Color 黑白红绿蓝黄紫红青 Transparency透明半透明不透明 字体尺寸 50%75%100%125%150%175%200%300%400% 字体边缘样式 无浮雕压低均匀下阴影 字体库 比例无细体单间隔无细体比例细体单间隔细体舒适手写体小型大写字体 重置 恢复全部设定至预设值 完成 关闭弹窗结束对话窗口
极越 01 实时 OCC 3D 地图网络演示但毕竟是作为彩蛋项目存在,这些未做标注的通用障碍物虽然会随着硬件实时感知进行实时刷新,但在刷新率上却并不和底层的地图道路模型同步,导致实际体验中画面会有股割裂感。
不过这种类似入侵后台读取数据的极客操作画面,嗯……倒也符合极越“汽车机器人”的身份。
OCC 占用网络渲染画面与现实世界画面对比在 OCC 占用网络全面上车的情况下,极越 01 的智能驾驶能力又会得到怎样的提升呢?我们选取了深圳罗湖中心附近的道路进行体验,如果用一个词涵盖极越 01 在 OTA 之后的表现,那我想稳定二字是最合适不过的。
(P.S. 下文中有关智能驾驶的部分均为在深圳及周边地区体验,能力或与推送升级后的部分地区有所差异。)
在第一幕中,可以看到这个 T 型路口由于右边的施工围栏,导致整个待行区域集体左移形成了异形路口,同时地面标线也显得较为无序,还有着对向右转车辆的干扰。
而在其中的极越 01 得益于 OCC 能力上车,SR 界面完整识别到了施工围栏,车辆路线规划也做出了相应调整,从而顺利完成这趟异形路口的无保护左转操作。
正在加载 视频播放器。 播放视频 播放 静音 当前时间 0:00 / 时长 0:00 加载完成: 0% 0:00 媒体流类型 直播 尝试直播,当前为延时播放 直播 剩余时间 - 0:00 1x 播放速度 节目段落 描述 字幕 音轨 Picture-in-Picture 全屏This is a modal window.
打开对话窗口。Escape键将取消并关闭对话窗口
文字 Color 白黑红绿蓝黄紫红青 Transparency不透明半透明 背景 Color 黑白红绿蓝黄紫红青 Transparency不透明半透明透明 窗口 Color 黑白红绿蓝黄紫红青 Transparency透明半透明不透明 字体尺寸 50%75%100%125%150%175%200%300%400% 字体边缘样式 无浮雕压低均匀下阴影 字体库 比例无细体单间隔无细体比例细体单间隔细体舒适手写体小型大写字体 重置 恢复全部设定至预设值 完成 关闭弹窗结束对话窗口
而在第二幕场景中,极越 01 也是精准地识别到路旁的障碍车辆,虽然后续识别模型有所误差,但传递给决策层后依旧成功地做出了绕行动作,绕开路旁的清扫车辆。
正在加载 视频播放器。 播放视频 播放 静音 当前时间 0:00 / 时长 0:00 加载完成: 0% 0:00 媒体流类型 直播 尝试直播,当前为延时播放 直播 剩余时间 - 0:00 1x 播放速度 节目段落 描述 字幕 音轨 Picture-in-Picture 全屏This is a modal window.
打开对话窗口。Escape键将取消并关闭对话窗口
文字 Color 白黑红绿蓝黄紫红青 Transparency不透明半透明 背景 Color 黑白红绿蓝黄紫红青 Transparency不透明半透明透明 窗口 Color 黑白红绿蓝黄紫红青 Transparency透明半透明不透明 字体尺寸 50%75%100%125%150%175%200%300%400% 字体边缘样式 无浮雕压低均匀下阴影 字体库 比例无细体单间隔无细体比例细体单间隔细体舒适手写体小型大写字体 重置 恢复全部设定至预设值 完成 关闭弹窗结束对话窗口
我们都知道百度在 AI 领域的探索十分深入,那作为百度旗下能和 ChatGPT 所抗衡的文心一言,在极越 01 上则是和 SIMO 相互结合起来——当一个车载语音助手拥有了生成式大模型能力后,能为我们带来什么?
那当然是能带来眼前一黑的操作……即使是较为抽象没有具体实例的问题,在结合了文心一言后的 SIMO 也能尽可能为大家答疑解惑:
“《人在囧途》里王宝强喝的是什么饮料?”具体拆分这个问题,首先由于提供的是演员真名,SIMO 需要在电影中找到演员对应的角色。而后需要判断语意表达,SIMO 在这方面捕捉到发令者的语意,是想要知道演员在剧中的一项具体行为,并做出相应解释和动作片段讲解,随后输出内容。
正在加载 视频播放器。 播放视频 播放 静音 当前时间 0:00 / 时长 0:00 加载完成: 0% 0:00 媒体流类型 直播 尝试直播,当前为延时播放 直播 剩余时间 - 0:00 1x 播放速度 节目段落 描述 字幕 音轨 Picture-in-Picture 全屏This is a modal window.
打开对话窗口。Escape键将取消并关闭对话窗口
文字 Color 白黑红绿蓝黄紫红青 Transparency不透明半透明 背景 Color 黑白红绿蓝黄紫红青 Transparency不透明半透明透明 窗口 Color 黑白红绿蓝黄紫红青 Transparency透明半透明不透明 字体尺寸 50%75%100%125%150%175%200%300%400% 字体边缘样式 无浮雕压低均匀下阴影 字体库 比例无细体单间隔无细体比例细体单间隔细体舒适手写体小型大写字体 重置 恢复全部设定至预设值 完成 关闭弹窗结束对话窗口
这也意味着车内的语音助手摆脱了其作为车控的单一身份,可以就某些有趣的问题与车内人员进行一问一答。当然,面对有意思的问答,你也可以选择将 SIMO 的答案发送到极越 APP 上。
而在具象化的问题上,SIMO 的车控身份又能与大模型的问答打通——比如“如何打开手套箱”,SIMO 在给出常规的解答后,还能记忆上下文,完整了解后续指令里缺失的主语,是控制前面提出的内容。
正在加载 视频播放器。 播放视频 播放 静音 当前时间 0:00 / 时长 0:00 加载完成: 0% 0:00 媒体流类型 直播 尝试直播,当前为延时播放 直播 剩余时间 - 0:00 1x 播放速度 节目段落 描述 字幕 音轨 Picture-in-Picture 全屏This is a modal window.
打开对话窗口。Escape键将取消并关闭对话窗口
文字 Color 白黑红绿蓝黄紫红青 Transparency不透明半透明 背景 Color 黑白红绿蓝黄紫红青 Transparency不透明半透明透明 窗口 Color 黑白红绿蓝黄紫红青 Transparency透明半透明不透明 字体尺寸 50%75%100%125%150%175%200%300%400% 字体边缘样式 无浮雕压低均匀下阴影 字体库 比例无细体单间隔无细体比例细体单间隔细体舒适手写体小型大写字体 重置 恢复全部设定至预设值 完成 关闭弹窗结束对话窗口
不过需要注意的是,现阶段仅有主驾驶位可以触发融入大模型后的 SIMO 语音助手,按照官方的说法是为了避免车内其他位置的指令对于生成回答的干扰。后续极越会在 2.0 版本中将会开放全车位置的大模型问答。
在关于 1.4.0 的更新说明文档中,“手机可投屏至车机屏幕”只占据了非常小的板块。但在实际使用后,我顿悟了……
极越关于车手互联的想法,在现阶段显得如此简单粗暴——把手机连上车载热点,啪的一下便能直接将手机画面投上车机屏幕了,不限品牌,不限操作系统,什么适配都不需要。
但这里有个非常匪夷所思的逻辑:车载热点目前只能靠进入车机投屏应用才能打开,而不是直接下拉找到开启按钮/右上角信号区域,开启入口藏得有点太深了。
连接完热点后,便可以在手机选择车辆进行投屏了虽然在这个版本极越只提供了投屏操作,并且投到车机屏幕后不能触控/常规情况都是竖屏……但当我随手拿出一台手机,连上热点就能投屏,这种返璞归真的操作好像是有那么一点在嘲讽目前封闭的车手互联生态。
大部分应用只能竖屏投屏,并没有做特别适配而尝试了几番后,极越这套投屏其实更像是我们在家中将手机/平板等投屏到电视一样的操作,投屏的应用可以在手机后台挂起,不影响手机的其他操作。
视频播放时有较大的一圈黑边 正在加载 视频播放器。 播放视频 播放 静音 当前时间 0:00 / 时长 0:00 加载完成: 0% 0:00 媒体流类型 直播 尝试直播,当前为延时播放 直播 剩余时间 - 0:00 1x 播放速度 节目段落 描述 字幕 音轨 Picture-in-Picture 全屏This is a modal window.
打开对话窗口。Escape键将取消并关闭对话窗口
文字 Color 白黑红绿蓝黄紫红青 Transparency不透明半透明 背景 Color 黑白红绿蓝黄紫红青 Transparency不透明半透明透明 窗口 Color 黑白红绿蓝黄紫红青 Transparency透明半透明不透明 字体尺寸 50%75%100%125%150%175%200%300%400% 字体边缘样式 无浮雕压低均匀下阴影 字体库 比例无细体单间隔无细体比例细体单间隔细体舒适手写体小型大写字体 重置 恢复全部设定至预设值 完成 关闭弹窗结束对话窗口
投屏视频播放效果,此时手机可以挂起投屏应用到后台在我看来,这套投屏还有非常大的空间可以挖掘——在保持多品牌多系统的适配下,如何对更多应用和场景进行适配,或许这对于无心插柳的极越来说,在日后也能成为车手互联的强有力推动者呢?
常用常新,这一次极越的 1.4.0 OTA 更新,无论是 OCC 占用网络的具象化,亦或是融入大模型的语音助手,都给人一种眼前一亮的感觉,“汽车机器人”,正在走上不断自我优化的正确道路上。
而受限于篇幅,部分细节上的优化并未放进文章,后续我们也希望极越官方能够继续为用户带来更好的用车体验。同时,我们也欢迎大家在新出行极越 01 社区分享自己 OTA 后的体验的报告。
来源:第一电动网
作者:新出行
本文地址:https://www.d1ev.com/carnews/pingce/223119
以上内容转载自新出行,目的在于传播更多信息,如有侵仅请联系admin#d1ev.com(#替换成@)删除,转载内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网,如有侵权请联系admin#d1ev.com(#替换成@)删除。