余凯博士在《自动驾驶之计算与处理器》主题演讲中指出,思考人工智能面对的感知认知决策控制,是不是一定要从软件驱动场景驱动的角度去思考这个问题?
余凯首先通过发问引发思考,我们知道在宇宙中最聪明的设备是什么?是人的大脑,人的大脑看所无所不知,无所不能,但是问题是不是这样呢?有时候大脑的行为也让人很费解,首先我们知道我们在处理图像不是按照顺序,实际上我们是不管前后上下,对图象变形处理,使得我们能够滑雪能够在高速公路飙车。但是我们又能够把这个数据接起来,我们有脑补的能力,这个能力是人区别于很多动物的根本,脑补能力使我们能干很多很奇妙的事情——你在不断预测未来,使得我们高效的处理很多的事情。
未来包括自动驾驶人工智能处理器,我们有很多思想借鉴到我们对大脑的理解。但是这些想法,我们针对这个场景去做专门的优化而不是做通用的问题,我们能够极大提升我们对这件事情的处理能力,在自动驾驶里面反映的就是足够的安全,足够的可靠。
他接着说道,还有一个趋势是计算,我们考虑到计算也像天下大事一样分久必合,合久必分,由移动互联网不断地中心发展,到现在云计算。从2017年开始,我们会看到另外一个趋势,就是很多很多的计算不断的往终端跑,自动驾驶就非常本质,我们在讲智能网联,包括像百度跟谷歌的自动驾驶都依赖于高精度地图,但是我个人认为自动驾驶的安全性的本质属性决定了,我们一定要让汽车在不联网的情况下面充分地安全、足够地安全。
在整个云计算互联网边缘节点上面去做本地计算是对自动驾驶非常重要的。中国的交通出行实际上是边缘计算,是世界边缘计算第一大场景。去年中国卖出了2800万辆车,美国是1700万辆,我们是毫无争议汽车销售大国,你很难找到像汽车对于海量数据的处理以及实时性要求这么高。我们知道一辆汽车对于自动驾驶每天会处理4-10到TB的数据,几千辆车比整个百度检索的量还要大,在自动驾驶这个边缘技术,中国交通出行是全球边缘计算第一大场景。
他指出,我们在思考技术的三大支点,从算法出发,去思考怎么样设计这样的处理器和架构,怎么使得它充分支撑它在本地的计算,要求我们全站式思考一个问题,不仅仅是软件或者硬件,包括软件和硬件的协同,包括系统软件包括云计算。
人工智能对自动驾驶非常重要,第一个是透明可追溯。整个软件系统透明性是非常非常重要的,如果有原因的话,如果出了什么事情一定要能够理解它然后加以控制。其他的包括端到端的学习,传统的人工智能系统都是训练的,但是未来得人工智能系统都是学习的,所以训练跟学习是两回事。它基本上就是一个灌输式的学习,其实人都是这样的。
还有一个就是硬件的友好,软件系统的硬件友好,这是通常做人工智能系统或者做软件的人不太关注的,在汽车方面因为涉及到整个性能、延时功耗和可靠性,需要软件和硬件高度配合。我们的设计思路,首先思考软件,思考软件同时我们做硬件,我们不做通用的神经网络处理器的设计,因为我们觉得自动驾驶这样一件事情足够难,我们把它计算平台设计得通用,会使它的效率并不足够高。在明年1月份,在拉斯维加斯地平线会向外界介绍我们第二代处理器的架构,这是一个核心像素级的图象处理设备。像素级的处理更加细节,它更加准确更加精确,这里面包括马路牙子,电线杆都处理过,包括背后有遮挡的行人、车边界更加的精确。
他分享道,我们跟德国人交流,德国觉得中国的自动驾驶几乎是不可能的,因为他们连人都不敢开车,我们慢慢慢慢走,这个其实是非常细的细节,我们开上四环,这些杆子也很重要,我们知道什么是移动、什么是不变,这个就对你的定位非常重要。基于这样我们的处理器,同时处理四路视频,我们把什么地方是柱子、什么是停车位我们都实时找出来。驾驶自动感知预测这个维度比我们现在思考的要复杂,这个对计算要求非常非常高。
地平线在支撑共享出行智能代客泊车。实际上你的自动驾驶刚需并不是人在车上,而是当人不用车时,你到了目的地、下车,你希望这个车自主的停车而不是你去停车,这个车的续航只有100多公里,它需要自主充电,它需要自主接下一个客人……这种情况下大规模的提高效率,但是同时它所应对的场景没有那么复杂,因为它只要低速就够了,这种场景下面实际上我倒是觉得它可能比乘用车最先的去实现,那么我们的设计思路就是只依靠视觉来做这个事情。
基本上我们的思考,地平线的商业定位我们只做赋能的赋能者,我们自己不会去做车,我们自己不会去做运营,我们的想法就是心无旁鹜的去打造处理器平台,然后去赋能我们的OEM。我们很多的创业公司,科研院所希望做底层的支撑性的平台,所以地平线的核心想法是做一个技术平台的供应商,因为未来整个产业的生态需要各种不同的玩家。
领取专属 10元无门槛券
私享最新 技术干货