1. 首页
  2. 大牛说
  3. ICU 3.0+NOH领航+1440T算力+3年100万辆车,毫末智行的「硬货」品牌日

ICU 3.0+NOH领航+1440T算力+3年100万辆车,毫末智行的「硬货」品牌日

关注并标星电动星球News

每天打卡阅读

更深刻理解汽车产业变革

————————

出品:电动星球 News

作者:毓肥

9 月 28 日,毫末智行举办了第三期品牌开放日。

和前两次相比,这次品牌开放日的毫末智行,「亮剑」的气氛明显更浓。简单点说,就是干货更多、数据更多、需要多想一会儿的技术思考更多了。

而另一个事实,是虽然毫末的品牌日已经举办到了第三期,但却是以每季度一次的高频率呈现。即使是技术立身的自动驾驶公司,如此高密度宣发,也是对技术积累的考验。

毫末智行 CEO 顾维灏在发布会上,将他们的智能驾驶哲学,凝练为「数据处理慢功夫」,一个很容易让友商放松警惕的概念——因为「慢」,听上去与智能驾驶的滚滚洪流,似乎并不对称。

但实际上,毫末智行昨天在开放日呈现的信息,或者表态,不像字面意义上的「慢」,甚至更像「快」。

比如国内首发高通 8540+9000 的智能驾驶方案——单芯片360T四芯片 1440TOPS 的高算力;

再比如引入 Swin-Transformer 模型,相比常规方式最多提高80%深度学习速度;

还比如使用无监督聚类,自动化挖掘每天数千万帧数据的价值、开发自动转化工具提高仿真测试速度,从每天仿真 30 个场景提升到 14400 个,等等。

无人驾驶进入深水区,需要解决的核心问题有两个:如何提高数据利用率?如何降低数据利用成本?

至于如何解决这些问题,毫末智行用品牌开放日给出了自己的答案。干货很多,术语很多,下面马上开始。

前言:车企孵化的自动驾驶技术公司?

成立于 2019 年的毫末智行,前身是长城汽车智能驾驶前瞻部,由长城汽车孵化而出,成为独立的自动驾驶人工智能技术公司。

也就是说,长城汽车既是毫末智行的大股东,也是毫末智行的大客户。

这样的路线,类似福特之于 Argo UI,通用之于 Cruise。也就是成熟车企独立孵化的自动驾驶技术公司。

这种模式的特点,是技术公司不仅保留了轻装上阵的独立性,距离量产车场景也还比纯粹的技术公司更近。

截止到技术日,毫末智行小魔盒累积的路测数据已经达到了 100 万公里,辅助驾驶打开率为 30%,未来三年的目标则是登上 100 万辆长城乘用车。

另外,张凯表示到 2025 年,长城汽车旗下所有新车型都会搭载 L2 技术,75% 车型搭载 L2+ 技术,其中 40% 车型搭载 L3 及以上技术。

这次技术日虽然有很多术语和干货,但毫末智行希望传递的核心信息,其实就是这两个 100 万,以及「2025 小目标」背后的意义:量产智能驾驶会遇到什么挑战?如何克服这些挑战,让更多汽车实现智能驾驶?

一、怎么把每一公里数据利用到极致?

100 万公里路测数据,是智能驾驶征程中的一个节点。

在毫末智行 CEO 顾维灏的演讲中,百万级的数据积累在他看来,更像是一块敲门砖。「我们发现了大量的,量产前想不到的情况。发现现实世界远远比我们想的复杂。」

他用「浩如烟海」来形容现实世界对智能驾驶的考验。

事实上,这样的考验并不来源于「里程」,而是来自每一帧视频画面。

拥有自主思考能力的人类司机,经过教育和实践之后,可以识别、分析并适应道路状况。比如你知道路边停着的共享单车不会自动冲出路面,也知道对向车道来车突然撞过来的几率很小。

但对于人工智能来说,光是让它「认清」这个世界,就已经难倒了无数工程师。

毫末智行将这种困难,总结为「如何找到对当前能力最有价值的数据」。顾维灏则用了一个词语:「诊断」。

这是毫末智行寻找有价值场景的具体方法,看懂这张图的门槛不低。

简单总结一下,就是毫末用了两套模型——云端的 fundamental model 全任务感知模型+车端的 domain model 部分感知模型,用类似于「找茬儿」的方式,实现了更高比例的自主诊断。

是的,找茬儿,找车端感知过程中的茬儿。

比如这张 PPT,很生动地展示了车端感知的三个常见「漏检」:道路远处已经变得很小的前车、被障碍物挡住的前车,以及只有部分被摄像头拍到的侧前车。

对于人类司机相当于 5.76 亿像素的视觉和极其精妙的大脑而言,这三个「漏洞」除非危险驾驶,否则基本不会出现。但对于人工智能,想要认清这样的 Corner cases,就必须依赖训练。

而如果同样的数据量,能够找到更多 Corner cases,那就是「寻找有价值场景」的效率更高。

这也是顾维灏提出「数据处理的慢功夫」背后的逻辑:慢,指的是深度挖掘同一组数据的利用率;慢的目的,则是为了少出错

二、自动化+Transformer,数据效率方法论

但顾维灏提出的「慢功夫」,也为毫末智行带来了新的挑战:数据量

在自动驾驶业内,路测里程数是一个相对通俗易懂的维度。但如果要准确描述深度学习的负担,用「帧」是更对工程师口味的。

毫末智行的工程师告诉我们,目前他们的路测车,每天可以产生数千万帧的视频数据。

随着 100 万长城乘用车装配智能驾驶「小目标」的临近,这样的数据量只会继续几何级增长——更何况,毫末智行才刚提出了不断挖掘场景的「慢功夫」。

那么,毫末智行会如何进入数据爆炸的智能驾驶时代?顾维灏给出的答案是「快」,或者说,「提高训练数据的效率」

1.提高效率,首先要提高深度学习训练速度。

Swin-Transformer,这是 PPT 上面非常重要的一张。

Swin Transformer是一种新型深度学习视觉模型,由微软首先提出,属于 Transformer 模型的一类——Transformer 和 CNN(卷积神经网络),属于目前比较主流的深度学习模型。

更具体的原理分析,本文就不展开了。简单总结一下 Swin-Transformer 的优点,就是相比起 CNN,它对数据量大的模型更友好,效率更高。

毫末智行表示,如果使用标准的数据并行训练,同样是 100 万帧的视频数据,4 台各配置 4 张英伟达 V100 深度学习卡的服务器,需要 64.3 小时。

但 100 万帧数据根本不算多——上文刚说了,现阶段毫末智行每天的数据量就达到了数千万帧,使用原始方法训练速度明显不够快。

顾维灏表示他们使用了数据和模型同时并行的混合方案,比如把模型、不同层的网络数据横向和纵向各自拆分,动态分配到计算卡显存里面。

结果如这个表格所示,优化后的迭代速度(橙色),可以提高50%-80%。

2.提高效率,还需要降低人力参与度。

毫末智行每天产生的数千万帧视频数据,根据我们了解到的消息,如果光靠人力「看」,速度只有每个人每天 1000 帧,效率极低。

所以除了必要的人工标注之外,毫末智行一直希望提高数据处理的自动化程度。

总结下来,毫末智行的自动处理,主要有「无监督聚类」、「CSS 自动转换+云端仿真」两个主要特点。

上面提到过,毫末智行使用了双模型对比的方式寻找错漏。而无监督聚类的作用,则是自动找到更多工程师想要的场景

举个例子,比如工程师需要「被树木挡住的车」,首先需要进行一次表征学习,把图片变成特殊的矩阵,基于这个特殊矩阵做自动化积累——最后所有「被树木挡住的车」相关图片都会自动分类。

毫末智行方面表示,无监督聚类过程不需要人工打标签,这个过程极大提高了数据利用的速度。

CSS 自动转换+云端仿真,则是毫末智行在传统方式基础上,加快验证速度的工具。

顾维灏表示,常规方法一套流程走下来,每个人每天只能验证30个场景,「而且人工设置的也很随意,经常会设置很多无效的场景,浪费时间。」

使用云端并行和自动转换工具之后,他表示目前每天可以自动生成一万多个仿真测试用例,PPT 上的数据则是 14400 个/天。

二、毫末智行+高通,最高 1440TOPS 算力?

自动驾驶深水区,一定是数据量和计算能力互相超越的「军备竞赛」。

数据量不仅来源于量产车数量,还来源于精度不断提高的感知硬件。

从明年开始,200 万像素,甚至 800 万像素就将成为智能汽车的标配。和如今主流的 100/130 万像素相比,对芯片的要求上了好几层楼——这也为「算力竞赛」推波助澜。

那么毫末智行,会为长城汽车提供怎样的算力?

2020 年 12 月 30 日,长城汽车与高通技术公司宣布双方在自动驾驶领域达成合作。长城汽车将是国内首批采用高通 Snapdragon Ride 平台的整车厂商。

也是在毫末智行的技术开放日上,我们第一次得知了高通智能驾驶芯片的代号——8540+9000。

其中 8540 是类 CPU+GPU 的 SOC 芯片,9000 则是专业负责深度学习的异构芯片,它们都将基于车规级 5 纳米工艺打造,单片 8540+9000 的功耗大概是 75W。

在 5 纳米工艺高通芯片加持下,毫末智行带来了新的「小魔盒 3.0」平台,单板可以达到 360TOPS 的算力,并支持升级到 1440TOPS,也就是 4 板联合的算力。

顾维灏则表示,75W 的 8540+9000 每秒可以计算 2 万帧数据。

目前,高通骁龙 Ride 平台已经在毫末智行上车测试。发布会上分享的数据,则是该平台已经帮助毫末智行的算法扩展了从感知到认知的各项任务,号称「端到端延迟低于30毫秒」

最后:「又干又硬」,智能驾驶的必修课

前两天,毫末智行公布了他们的高速公路领航辅助功能 NOH(Navigation on HIpilot)。到了品牌开放日上,官方表示目前已经适配 31 万公里的高速公路和城市快速路。

进入 2021 之后,毫末智行在加速。这是长城汽车进入智能驾驶时代的主客观要求,但加速的前提,是技术够硬、够干。

这是作为一家自动驾驶公司必须做到的,也是毫末智行一直希望证明的。

NOH 高速领航辅助、新的深度学习模型、高自动化数据处理,这些是发布会打在 PPT 上的成果。

此外,毫末智行的人员规模,还是另一个低调的发力点——毫末智行团队目前超过 500 人,预计在今年底超过 700 人,明年达到 1000 人,其中硕博比为 50%。

除了名词、术语、数据,成为国内首批跟高通合作并量产智能驾驶平台的自动驾驶公司,还能看出毫末智行希望成为头部玩家,也就是他们的「野心」。

顾维灏在开放日开场的时候这样说:「谁能用最低的成本,得到最多的数据,用最快的速度进行产品迭代,谁就将获得未来竞争的胜利。」

从发布会上看,毫末智行在往这样的方向走,至于能不能赢,那就要看 2022 年落地的表现如何了。

(完)

来源:第一电动网

作者:电动星球News蟹老板

本文地址:https://www.d1ev.com/kol/157625

返回第一电动网首页 >

收藏
62
  • 分享到:
发表评论
新闻推荐
第一电动网官方微信


第三方登录
小程序

反馈和建议 在线回复

您的询价信息
已经成功提交我们稍后会联系您进行报价!

第一电动网
Hello world!
-->