1. 首页
  2. 资讯
  3. 市场
  4. 大模型上车,没那么简单

大模型上车,没那么简单

盖世汽车 青柠

自去年ChatGPT发布之后,大模型的热度持续高涨。国内企业迅速跟进,前有百度文心一言、阿里通义千问,后有讯飞星火,加上商汤、腾讯等多家企业,共同开启“百模大战”。

一场场的发布会向公众展示大模型在各个垂类领域的应用前景,开启了一场人工智能的狂欢。而对于汽车领域,众厂商发挥巧思,在智能座舱、自动驾驶等方向似乎都有大模型应用的广阔天地。

“大模型在很多产业上都在使用,但对于一个AI的应用或者技术,最重要的是应用场景。我们认为汽车是大模型最大的应用场景。”在日前举办的未来汽车先行者大会上,斑马智行副总裁徐强如是说道。

前景是美好的,现实又是怎样的呢?大模型上车,真能那么顺利吗?

使用前景

在未来汽车先行者大会上,中国工程院院士、清华大学教授、国家智能网联汽车创新中心首席科学家李克强谈到,大模型顾名思义就是通过大量的数据训练,得到一个基础大模型,然后基于这个模型根据专业运用进行微调,在自然语言处理和看图片、听歌、识别、文字编辑等方面有很多应用。

大模型上车,没那么简单

图片来源:未来汽车先行者大会

从功能上来看,目前人工智能在汽车上主要有两种落地形式,一类是用于人工智能对话领域,多数应用在智能座舱。

有观点认为,大模型融入智能座舱,将重塑汽车空间,重新定义人与汽车的关系,推动智能汽车向三生活空间转变,同时让汽车更显情感化,满足乘客更深层次的生理和心理需求。

这也符合用户对大模型产品上车的第一印象,即通过大模型产品,加强车内语音对话等智能座舱表现。

上海车展期间,商汤科技亮相日日新Sensenova大模型,展示了其中文语言模型“商量SenseChat”以及“如影SenseAvatar”等与座舱的结合;此前阿里巴巴也宣布AliOS智能汽车操作系统已接入通义千问大模型进行测试等。

另一类则是聚焦智能驾驶,比如毫末智行发布了自动驾驶生成式大模型DriveGPT,帮助解决认知决策问题,最终实现端到端的自动驾驶。

“AI技术加速了自动驾驶规模落地,自动驾驶是人工智能的典型应用场景,人工智能赋予智能汽车超级大脑。以规划决策为例,目前已经实现了从基于规则到基于自学习算法的规则,自学习算法能够超越经验系统,更加聪明处理复杂场景,大幅拓展自动驾驶的设计运行范围。”百度自动驾驶业务部总经理陈卓说到。

据陈卓介绍,百度依托文心一言大模型,实现了技术驾驶技术和应用的突破,文心图文大模型具有数千种物体识别能力,拓展自动驾驶语义识别的数据,如消防车、救护车等特殊车辆,让解决自动驾驶长尾问题的效率得到提升。此外,得益于文心大模型超大参数规模,通过大模型训练小模型,自动感知泛化能力也显著增强。

陈卓表示,通用AI技术在自动驾驶带来的突破,让大家对其在汽车行业的想象更加真实。

应用现状

基于大模型显露出来的种种优势和可能性,车企对大模型显露出了足够的兴趣,比如百度的文心一言,已有东风日产、红旗、长城等近十家车企宣布接入。

在上个月华为nova11 系列及全场景新品发布会上,华为常务董事、终端BG CEO、智能汽车解决方案BU CEO余承东透露,AITO问界M9将搭载AI大模型,详细功能体验将在今年秋季AITO问界M9发布会上揭晓。

6月16日,美国微软公司和德国汽车厂商梅赛德斯奔驰公司宣布,双方将展开合作,把ChatGPT人工智能服务整合到存量汽车中,美国地区90万辆汽车将因此受益。

梅赛德斯奔驰介绍,未来车主在使用语音助手提问时,ChatGPT将会负责回答问题,增强汽车语音助手的negligible。微软公司发言人介绍称,这也是ChatGPT产品第一次应用在汽车环境中。

5月,百度Apollo汽车智能化业务展示了以文心大模型为基础的新一代AI智舱探索成果。百度Apollo演示了基于文心大模型能力探索下,智舱将具备出行场景对话式交互、逻辑推理、策略规划和知识问答等多项能力,同时也展示了在当前智舱命令式交互下覆盖全车多音区、毫秒级响应、免唤醒全时交互的体验。

百度Apollo方面表示,该公司对下一代车载语音展望是:将命令式交互做到极致,速度最快、全时交互、覆盖全车所有音区。据悉,这是国内首个大模型在汽车行业应用的成果探索,有望在未来推进量产。

大模型上车,没那么简单

图源:百度Apollo

值得注意的是,在现场演示的过程中,依然存在延时、语义理解不清晰等问题,有待精进,但已显露大模型大模型赋能智能座舱的实践可能。

至于大模型在自动驾驶方面的应用。6月20日,理想汽车公布了智能驾驶最新进展,称理想AD Max 3.0进入大模型时代,本月内将向北京和上海的内测用户交付不依赖高精地图的城市NOA功能,下半年将向用户开放通勤NOA功能。

大模型上车,没那么简单

图片来源:理想

理想汽车表示,有了通勤NOA,无需等待整个城市NPN特征训练好,只要设定好自己的通勤路线、自车学习NPN特征,学成之后就可以在这条路线上使用NOA功能。该功能核心是采用了BEV大模型,可以在绝大多数的道路和路口,实时生成稳定的道路结构信息。但对于城市中的复杂路口,仅通过BEV大模型来进行感知依然不够稳定。理想汽车的解决方法是通过NPN特征增强BEV模型。

据了解,NPN指的是神经先验网络(NeuralPriorNet),车辆会提前进行路口NPN特征的提取,当车辆再次行驶到该路口时,将之前提取好的NPN特征拿出来,与车端感知大模型的BEV特征层相融合,最终得到完美的感知结果。理想汽车表示,通过NPN特征增强BEV模型,相关工作的论文,会发表在AI领域的国际顶级会议CVPR上。

此前,李想在微博发表观点称“智能驾驶和智能空间都已经进入大模型时代,大模型的研发和训练是智能电动车企业的必要能力,否则只会停留在电动车的时代。”

长路漫漫

大模型在智能座舱上的应用是可以直观感受的,现在已有一些成果出现,但对于自动驾驶,大模型上车还有很长的路要走。

“自动驾驶的本质属性是用装置来替代人的操作,从这个角度来看,人工智能是汽车向更高级别的智能化发展时必须要有的专业技术。目前来看我们可以用大模型更好地获取、加工数据,更好地做一些场景建立,做一些算法的初步迭代、训练。”李克强说到。

但李克强也指出大模型是好的支撑方法、支撑工具,在汽车里面已经有很多应用领域,但是在深层领域还要做很多工作。

不可否认,对于大模型上车,大家是充满期待的。但是现实状况是,除了一些交互的表层应用,要想在自动驾驶等领域进行深层应用,还有很长的路要走。

每次人工智能的突破,必然会引起一次行业发展的热潮。早前,分析型的人工智能,在图片分析领域,已经能做到猫和狗的识别。彼时的人们期待其在自动驾驶领域的应用,因为既然计算机能识别,那么应用在汽车领域,也能识别那些事障碍物,哪些是人或猫狗。

以特斯拉为主的相关玩家投身该领域,2014年特斯拉就推出了FSD,并且表示很快就能实现自动驾驶,但是直到现在,已有近十年的时间,仍然无法真实的大规模上路。

去年年底到今年年初,以ChatGPT为代表的生成型的人工智能,又带来一场狂欢,大家很自然就想到能不能把这项技术再用到智能汽车上。

加拿大工程研究院院士、人工智能与数字经济广东省实验室(深圳)执行主任于非坦言:“我自己的一点想法是,大家对人工智能期待有点高。”

大模型上车,没那么简单

图片来源:未来汽车先行者

于非把汽车分为三个部分来看:第一是感知部分,第二是模型部分或者思考部分,第三是执行部分。于非认为,从历史角度来看,感知部分的技术已经非常成熟,思考系统正在发生一次非常大的裂变,但是执行部分的大变革还没有真正到来。

“大时间尺度的秒级、分钟级的逻辑推理,用大模型可能比较适合,但是小规模、小时间尺度的,尤其是汽车的控制领域方面,我觉得还有所不足,还有很长的路要走。”于非说道。

大模型在汽车领域的应用还存在多方面的风险,包括整个生态上是否已准备好,车端是否有足够的算力与资源来运行模型。

“现在真正的模型数据调动管理需要利用智能网联汽车以及计算技术平台、云控技术平台等平台,只有大量的数据汇聚才可做交叉,特别是垂直领域,这和娱乐系统、服务系统不一样,从产业互联网的角度来看,若基础云平台不能打通,很难实现向深层领域推进。”李克强说到。

此外,在道德和法律层面,大模型上车也还存在一些限制,归到最后的场景落地,人工智能能否满足车辆对实时性、安全性等方面的超高要求,或者什么时候才能满足,都是个问题。

大模型或许有可能打开智能汽车深层进化的大门,但就现在而言,只能说是有可能。

来源:盖世汽车

作者:青柠

本文地址:https://www.d1ev.com/news/shichang/205532

返回第一电动网首页 >

收藏
39
  • 分享到:
发表评论
新闻推荐
第一电动网官方微信

反馈和建议 在线回复

您的询价信息
已经成功提交我们稍后会联系您进行报价!

第一电动网
Hello world!
-->