1. 首页
  2. 大牛说
  3. 假如路上跑的不是汽车,而是阿尔法狗?

假如路上跑的不是汽车,而是阿尔法狗?

【第一电动网】(专栏作者 夏珩)为期一周的人机世纪大战最终以谷歌人工智能围棋手AlphaGo四胜一负完胜人类世界围棋冠军李世石9段落下帷幕,引发了全人类对人工智能的关注狂潮。 AlphaGo(阿尔法狗)的强劲表现令科技界产业界为之振奋, 而未来其所代表的人工智能(AI, artificial intelligence)技术在智能驾驶等领域的发展则更加让我们期待。 为什么这样说?我们从两个方面来聊一聊。

第一是深度学习,从大数据中学习发掘规律。 AlphaGo和李世石对弈, 都是在决定下一个子落在哪里的问题。 一个19*19的棋盘最多就有了361种选择。 而最终的胜负是由这几步、几十步、甚至上百步决定的。 所以围棋是典型的动态决策系统, 每一步都影响了后面的结局,每下一步我们都不得不去考虑接下来的几步应该是怎么样的, 这一步落子对后面有什么影响。 这也就是咱们说的棋盘推演。若是由电脑来做推演, 去考虑落子的各种可能性,从中选出最有胜算的一招,那人还有胜算吗? 1997年‘深蓝’就是利用类似的‘穷举法’打败了当时的国际象棋世界冠军卡斯帕罗夫。围棋难就难在它的变化太多, 复杂度太高了,和国际象棋完全不在一个数量级, 就算是让深蓝用上当今最快速的硬件去硬算围棋的棋盘推演, 深蓝也只能对你说臣妾做不到呀。

假如路上跑的不是汽车,而是阿尔法狗?

人机世纪对决(图片来源于网络)

人比‘深蓝’高明的一点就是棋感。 人根据棋局评感觉, 而不必做细致的棋盘推演, 就能大概筛选出一些较好的选择; 对于走一步之后的局面, 人能大概判断出是赢面大还是输面大。所以人就避免了穷举棋盘推演, 只需针对少量的选择做些有效的搜索即能做出落子判断。 从决策规划的角度考虑, 这就好比把一个动态规划的问题用近似动态规划(ADP)的方法解决了。而对棋局的简单有效的评估就类似ADP中的value function(价值函数), 落子的倾向性选择类似ADP中的heuristics(试探法)。这种valuefunction和heuristics就是围棋中的规律。 AlphaGo的成功就在于它的算法中包含了这两个规律,而不仅仅是野蛮搜索。它的规律是通过机器学习获得的, 这就是AlphaGo背后的两大技术本质:大数据和深度学习。通过学习几千万局的对弈过程数据,训练后的人工神经网络中固化了优秀棋手的落子倾向和对局面的判断能力。 这样在实时的人机对弈过程中, 其所需要搜索的空间范围已经收缩到一个可计算的范围内, 最终选定最佳落子。 而深度学习持续不断的学习对弈数据, 使AlphaGo始终保持进步。

二是数据、学习与互连,让AI做你的智能驾驶司机。AlphaGo的胜利只是针对一个博弈游戏,但是AlphaGo的算法是通用的机器学习算法,而不是特定于围棋一种应用,所以真正有意义的是人工智能已经在影响技术领域。 AlphaGo经过学习打败了围棋世界冠军, 那么AI技术用在汽车领域呢?人工智能驾驶会不会成为世界上最优秀的司机? 当前不是, 但是这个进程已经开始。

人就是智能驾驶的老师, 每天的行驶数据(路况, 地图, 交通信息, 驾驶员的操作)中包含着驾驶和交通的规律。AI技术通过学习这些大数据就能掌握人所掌握的规律。特斯拉(Tesla) 的Autopilot 1.01就已经具备了学习的功能。特斯拉的用户们已经报道了他们的汽车每天的变化, 一开始不能很好保持在弯道行驶上的特斯拉汽车,渐渐地学会了在弯道上减慢车速从而实现车道保持。

假如路上跑的不是汽车,而是阿尔法狗?假如路上跑的不是汽车,而是阿尔法狗?假如路上跑的不是汽车,而是阿尔法狗?

小鹏汽车工程师对标Tesla Model S

而这种学习更大的力量在于它可以不仅是一辆车的学习, 更可以是所有的特斯拉汽车的共同学习。 汽车已经有了互连网络的属性,驾驶数据从每一辆汽车传输到云端, 所以是一个群体去训练同一个机器大脑。 这一点是比人脑更有优势的地方, 一个人的学习只能依靠自己的数据, 而机器学习却能从所有人的数据中去发现规律,从而有望学习到最全面的驾驶规律, 超越每一个个体。 并且这种学习成果的分享性更是人类所不能及。 云端的AI可推送到每一个汽车中,实现数据的闭环。所以以后的汽车应该是具备本地学习能力以及互连群体学习的功能。 目前能提供这种基础构架的例如NVIDIA发布的PX2车载终端, 其每秒可进行24万亿次深度学习计算。 我们小鹏汽车在设计之初就考虑了这种需求方向,智能与互连是我们的属性, 汽车-数据-网络-后台, 系统的框架能够让AI今后在我们的汽车上发挥作用。

机器学习甚至意味着能够发现人类驾驶数据中没有包含的规律。 好比AlphaGo通过左右互搏,产生大量新的对弈数据,通过加强学习(reinforce learning)刺激AlphaGo发现更优的围棋路数。在智能驾驶领域, 通过仿真交通场景, 让AI自己去发现智能驾驶的问题与局限, 今其产生更好的规划、决策和执行。

智能驾驶技术的成熟尚需时日, 正如人工智能技术本身同样处于快速发展中一样。 越来越多的技术会最终应用于智能汽车, 通过学习不断提高驾驶水平,带来更加安全更加极致的驾驶体验。

我们的司机是AI, 这一天终会到来,我们也会尽情的享受这种变革给我们带来的便利,而不会再觉得是被碾压了。

作者系小鹏汽车总裁

来源:第一电动网

作者:夏珩

本文地址:https://www.d1ev.com/kol/42653

返回第一电动网首页 >

收藏
61
  • 分享到:
发表评论
新闻推荐
大牛作者

夏珩

小鹏汽车创始人&总裁

  • 1
    文章
  • 61
    获赞
阅读更多文章
第一电动网官方微信

反馈和建议 在线回复

您的询价信息
已经成功提交我们稍后会联系您进行报价!

第一电动网
Hello world!
-->