自动驾驶男子天团齐聚CVPR,他们在顶级学术会议上讨论了什么?

雷锋网按:今年的CVPR已经落幕。回顾这届CVPR,无论是会议议题还是产业落地的热度,自动驾驶都是聚光灯下的焦点。本届CVPR还专门设置了针对自动驾驶的Workshop(Workshop on Autonomous Driving Challenge)。

在Workshop当天的圆桌讨论环节,几乎聚齐了国内自动驾驶领域的佼佼者——图森未来的CTO侯晓迪,Pony.ai CEO 彭军(James Peng),驭势科技CEO吴甘沙,乐视智能驾驶VP倪凯,此外还有硅谷自动驾驶公司Auto X创始人肖健雄以及加州伯克利Deep Drive项目的研究员Fisher  Yu。

自动驾驶男子天团齐聚CVPR,他们在顶级学术会议上讨论了什么?

图片从左往右依次是:Fisher Yu、彭军、肖健雄、倪凯、吴甘沙、侯晓迪

上述6人组成的自动驾驶男子天团,在CVPR的圆桌上主要讨论了3个问题:

  • 1. 高精地图在自动驾驶中的使用和重要性;

  • 2. 端到端学习的可用性和安全性;

  • 3. 系统冗余的设计。

几乎所有在场的嘉宾都认为,高精地图在自动驾驶中能发挥重要的作用。

吴甘沙举了一个例子,当自动驾驶汽车想要超车时,高精地图提供了前方车道、道路曲率等信息,这能让超车动作更安全。但大家同时面对的问题也是,高精地图的创建和维护成本太高,自动驾驶解决方案中不可能包含一份全面完整的高精地图。

AutoX创始人肖健雄(Professor X.)指出,一些特定场景下的高精地图还是能够做得很好,因为环境受到控制,更新也相对容易。Pony.ai CEO 彭军则认为对于高精地图,需要更进一步明确它的定义,相比于我们通常认为的包含车道线、路标等信息的地图,对自动驾驶来说,更重要的是对静态物体的感知地图(perception of the static objects),在自动驾驶的实战中,对静态物体的感知和描述能发挥更大的作用。

高精地图的更新和维护会是怎样的?大部分嘉宾的观点是,未来图商会提供地图的底层,而自动驾驶汽车们则会以众包的形式承担更新地图的角色。

第二个问题是关于端到端的学习。

端到端学习表现出来的行为跟人类的驾驶行为接近,人类通过积累驾驶经验能够下意识(潜意识)地完成开车,而端到端学习通过大量的数据训练也能达到类似的效果。但现在的问题在于,我们还没有足够多的数据能够让端到端学习的方案足够安全,达到可量产的标准。

第三个问题是系统冗余的设计。

系统冗余可以分成很多个层面,包括传感器层面、硬件层面、软件层面等等,但同时冗余也并不意味着系统中要设计多个重复的模块。那么合理设计的冗余是怎样的?

以下是CVPR上自动驾驶男子天团的对话,雷锋网作为少数在场的媒体,整理了他们的对话内容如下(对话有删减,内容未经讨论嘉宾本人确认)。

侯晓迪:第一个问题是关于高精地图的重要性,以及怎样在自动驾驶中使用高精度地图?

肖健雄:高精度地图对于自动驾驶是非常有帮助的。但问题在于你真的能拥有所有的地图吗?创建和维护高精度地图的成本都是非常昂贵的,不仅是资金的问题,在运营上难度也很大。如果现实环境发生了一点点的变化,对高精地图中数字世界的影响都很大。我知道驭势在做一些绘制校园高精地图的工作,这样环境相对受到控制,实际上能做得非常好。所以这非常取决于你的应用。

侯晓迪:这个问题同样要问问James,我看到你们的demo中有很亮眼的地图方面的API。

彭军:我想在回答这个问题之前,要更具体地讲一下地图的定义,大家常说的高精地图,指的是车道、行车标识等等,我们也认为非常重要,我们也在使用这样的地图。但还有另一种地图更加重要,而可能了解它的人更少,我们管它叫static map,或者叫perception of the static objects。

我们都在尝试让自动驾驶技术更安全,但车载计算硬件的性能远远不够,如果我们预先掌握周边环境的更多信息,那自动驾驶就会更加安全。所以我们建立的地图,是帮助自动驾驶汽车提前建立对外界的感知。

吴甘沙:我也认为高精地图是非常好的技术。因为当前大部分自动驾驶解决方案都不能保证能够实时精确地感知外部世界的所有细节,高精地图可以帮助补充这部分的能力。长线来看,高精地图会给自动驾驶锦上添花(nice to have)。

像James说的一样,高精地图是一种超越LiDAR的传感器。今天的自动驾驶解决方案都依赖LiDAR、毫米波雷达、摄像头等等,但每一种传感器都有自己感知范围的局限。当一辆自动驾驶汽车执行超车时,如果你没有足够的车辆前方的环境信息,这样的超车动作可能是危险的。而高精地图提供了车道线、道路曲率以及前方岔口等环境信息,能帮助自动驾驶汽车更安全地完成这个动作。

倪凯:对于未来的自动驾驶汽车,高精地图是非常有用的。眼下在一些车型上已经实现量产的L2的功能,它可能不太依赖高精地图,但在未来L3和L4的自动驾驶上,高精地图的重要性会越来越高。

其次,补充一下关于高精地图维护更新的问题,我们也需要考虑是在哪些模块中使用高精地图。如果在感知模块中使用高精地图,此时一些滞后错误的信息可能会带来混淆;但如果是对交通规则(Violation Module)判断,比如通过对交通灯、车道线的信息判断车辆是否遵守交通规则,此时缺乏一个红绿灯的信息,可能不会带来非常严重的后果。

Fisher Yu:最终,道路上的每一辆汽车都会变成自动驾驶。我们可以协调这些车辆在道路上一起采集数据,一起去处理这些数据。但问题在于由谁来推动这个过程?我认为很可能是像今天的Uber司机或者职业司机这样的角色。

吴甘沙:我觉得在未来,图商们会创建基础的地图(the foundmental basic map),这种地图不会经常发生变化。自动驾驶汽车们也会具备更新基础地图的能力,就像Mobileye今天所做的一样。所以高精地图最终会由图商来提供基础地图服务,各种各样的自动驾驶汽车来完成地图的更新维护,这就是Live Map的概念。

侯晓迪:我知道Fisher在伯克利的Deep Drive项目在进行一些端到端强化学习的研究,所以我们如何去保证端到端学习的安全性?

Fisher Yu:我们一直在尝试探索技术的前沿,如果我们有足够多的驾驶数据,有足够多的驾驶视频,我们希望在未来能够引入一种更有效地处理这些数据的机制,也许在未来的5年之内,我们能够建立一套冗余机制,能够在紧急状态下保证驾驶的安全。

彭军:我们的目标是打造安全的自动驾驶汽车,所以我们会采用各种不同的技术,端到端学习是非常有意思的技术,我们会在未来进行一些探索,尤其是和一些学院和研究机构一道。

肖健雄:到端到端学习的方法解决交通问题是非常困难的。因为实际交通状况下的场景是非常复杂的。

倪凯:在目前的阶段上,我们都在尝试将技术原型变成能够量产的产品。但对于端到端学习而言,我不认为现阶段有足够多的数据和研发资源将端到端的学习变成一种可量产的技术。

吴甘沙:我个人对端到端学习非常感兴趣,大家也谈到它需要非常非常多的数据。而我个人对这项技术很感兴趣的原因是,它非常接近人的驾驶行为,当人积累了足够多的驾驶经验,就能够按照潜意识开车。《Think Fast and Slow》的作者提到人有2套系统,一套“快”系统和一套“慢”系统,快的系统是潜意识的,慢的系统则是经过逻辑推理的一套系统。自动驾驶汽车也一样像人一样,有这样快和慢的2套系统,能够随时接管并且做出理性的决策。

肖健雄:对于人而言,人用潜意识开车的时候,他可能会放空大脑,或者做跟朋友聊天这样类似的事情,但计算机是100%聚焦在驾驶上的。所以在这个时候,选择通过端到端学习的方式来节约算力,我对这样的策略是不确定的。因为如果能把系统的计算容量提升上来或者通过工程手段减少计算量,它是能够解决自动驾驶的问题的(而不一定需要依靠端到端学习)。

侯晓迪:现在在我们的自动驾驶系统设计中,使用了哪些冗余的措施,比如驭势现有的一些原型设计中?

吴甘沙:我觉得需要在不同的层级上设置冗余。比如在传感器层面,我们会给系统配置激光雷达、毫米波雷达、摄像头等等,你可能不需要把所有的传感器都配置上,但你至少需要2 – 3种的传感器。

在硬件层面,在电源供电方面可能需要冗余,计算硬件可能需要冗余,甚至在执行机构的层面上,比如刹车系统是需要冗余的。

在软件层面上,我们可能也需要不同的算法或者不同的进程来计算同一个结果,完成同一个目标。这样的冗余是非常有价值的。

倪凯:首先我们在关注传感器层面,多传感器的融合是非常重要的,因为我们会有很多种不同的传感器,它们给予你不同距离、不同天气状态下的感知能力。

在L3、L4的自动驾驶中,在系统的层面,我们至少要设计2套不同的系统,一套是更成熟的系统,来处理99%的路况,当这套系统失效时,无论是芯片的原因还是电源出现问题,还有另外一套紧急响应的系统能够接管和保证安全。

彭军:大家需要注意的一点是冗余的设计并不意味着你的系统中要有很多套重复的模块。我完全同意倪凯的观点,在系统层面上,我们需要设计不同的系统提供冗余。

对我们而言,我们会设计一套处理普通的驾驶情况,然后是紧急刹车(停车)系统,我们也需要系统来完成车道线保持、减速等驾驶动作。

雷锋网(公众号:雷锋网)推荐阅读:

深度学习集体瓶颈,产业化加速时代CV研究出路在哪里?| CVPR 2017

原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/114090.html

(0)
上一篇 2021年8月27日
下一篇 2021年8月27日

相关推荐

发表回复

登录后才能评论