雷锋网按:智行者科技 CTO 王肖博士在汽车创新港微课堂的分享,已授权雷锋网(公众号:雷锋网)编辑与发布。
王肖,清华大学汽车工程系博士,北京智行者科技 CTO。他曾作为核心人员参与并获得 2012、2014 及 2015 中国智能车未来挑战赛冠军,获得汽车工业科学技术进步一等奖、军队科技进步奖等多项奖励,参与起草中国智能网联车辆技术路线图。
本文内容主要包含以下三点:
-
为什么选择无人物流作为首选落地场景;
-
蜗必达-无人物流车集成解决方案;
-
AVOS 设计思路及关键技术介绍。
智行者其实是一家非常年轻的公司,核心团队人员从事智能车的研究已经非常长,主要是来自于清华大学汽车系李克强教授的实验室。
智行者成立于 2015 年 6 月,短短两年的时间我们做了很多工作。
2016 年北京车展前夕,长安汽车从重庆到北京 2000 公里自动驾驶的测试中,我们参与了部分城区自动驾驶研究工作。在北汽推出的自动驾驶试乘展示里,我们也做了很多相关工作。
这两个项目当时在北京车展取得了很大的反响。2016 年 10 月,我们在杭州参加了阿里云栖大会,而且首次在国内推出了低速自动驾驶观光车, 7 天之内我们差不多接待了 2000 多名乘客,整个演示过程非常顺利,外界给我们评价很高。
除了封闭区自动驾驶外,2016 年底我们开始启动高速自动驾驶季度的拉练,也就是我们每个季度会选择一条路线作为长途拉练。
去年 11 月,我们从北京到北戴河进行来回五天的拉练测试,主要是在国道上进行我们的算法测试。车上有非常周密的安全措施,比如驾驶员可以随时介入、有紧急按钮等等。
进入 2017 年后,我们通过一年多的团队锻炼、技术积累以及我们对自动驾驶市场的整体判断,我们选择了「低速物流」作为首选的落地场景。
自动驾驶眼前的「苟且」
*「四步走」战略
我改写了一句比较时髦的话:「自动驾驶不仅有诗和远方,更有眼前的苟且」,但是这个「苟且」是打引号的。我想说的是智行者的基因实际上是一个自动驾驶产品导向型的公司,而不是一个纯技术导向型的公司。
具体说来,智行者会根据用户需求来定义产品。用户需求包括成本、功能等等,我们选择当前最成熟、最合理的技术方案进行产品化,而不会去追求采用单个相机来解决所有问题的学术型流派思路。这也是我们与一些 AI 公司最大的区别,我们是做产品,而不是纯粹做算法。
上图是我们的「四步走」的战略,需要说明一下:SCR、GCR 缩写词是智行者内部的叫法,并不代表官方说法。
概括讲,我们的战略由简单到复杂。说白了,先把我们自己的“肚子填饱”,基础打好,这才有力量去迎接真正属于自动驾驶的诗和远方。否则当前目标如果过于远大,对于创业公司来说,可能根本熬不到诗和远方那一天。
2016 年,我们做了非常多主机厂的演示项目,如北汽、长安,我们都全身心参与,所以团队积累了很多经验和资源。2017 年我们将重心就放在低速自动驾驶,而且提升到一个产品的高度,并不是说只是演示。
我们坚信,自动驾驶与我们常规车辆一样,并不是要用多么先进的方法,更不是采用 Deep Learning (深度学习)学习数据就能一蹴而就。它需要从业者以极大的耐心和无数的失败,才能真正的做出一款可能看似比较简单的产品。
我们的思想是,只有先把特定场地的自动驾驶做好,不断积累经验和数据,打好基本功,才有资格去尝试城市和高速的自动驾驶产品。否则,稍有不慎可能造成巨大的交通事故,这也就是我们造车与做手机的人不同的思路。汽车是关乎乘客生命安全,并不是说手机死机就重启这么简单。
无人配送物流车:为什么是当前最佳落地场景
我们首选低速场景作为一个入口,实际上低速也包含很多,比如低速扫地车、低速景区观光车,还有园区通勤车辆,这都属于低速车辆。
我们认为当前自动驾驶要落地,有两大关键指标,需要强调的是「当前需要落地」,而不是 10 年、20 年要落地,这两大指标就是:现实刚需程度和可预期安全风险。
现实刚需程是指眼下的自动驾驶是不是社会以及客户所需要的。这里的产品是客户掏钱买来,需要产生利润,而不是说为了演示或参加比赛而使用的。我认为,现实的刚需程度如果把控不了,那可能成了赔本赚吆喝。
比如我们参加了很多的比赛和演示,非常热闹,媒体评价非常高,但是实际上最终没有人给你掏钱,那么最终实际上还是一个演示。
可预期的安全风险是指我们在一些非常极端,功能失效的情况下会造成多么严重的安全事故。
比如,在新闻报道里,载货大卡车由于制动器失效导致车毁人亡的事故。同理,我们做算法或者做产品也要好好考虑:哪怕现在用最先进的技术手段,如果说大规模上量一千台、一万台的产品,我们会有多大的概率出现多大的交通事故?这是我们做产品要非常值得考虑的事情。
我们认为,针对当下的社会需求以及技术水平,低速载物最具落地优势。
载物自动驾驶到底有没有社会需求?我们从数据上分析,这两幅图集中反映目前中国电商的繁荣以及为消费者所带来的便利,其实很大程度上是建立在巨大的人力成本上。
2015 年,中国物流占 GDP 的 18%,但美国可能只有我们的一半甚至少一点。同样,未来快递行业并不是已经发展到顶峰。
根据相关数据预测,在未来 3 到 4 年可能还会翻倍。试想一下,在未来 10 年、20 年人口下降的情况下,如此大规模的一个送货方式还能继续维持吗?
随着快递员的工资越来越高,电商的核心竞争力到底在哪里?如果单纯只是一个劳动密集型产业,我相信这不是长久之计。既然有这么大的产业,那么我们应该将成本降下来,来真正提高他们的核心竞争力。
上图数据显示,目前中国物流行业成本最高的环节,并不是卡车司机、仓储管理,而是最后一公里的一线快递员。
从图中可以看出,2016 年快递相关的从业人中一线快递员占了总体一半以上。从这个角度考虑,如果把一线快递员无人化后,它的经济效益肯定会显著上升。
同时从另外一个社会影响角度讲,目前人力电动三轮这种送货方式,由于数量越来越多,三轮车本身行驶速度非常快,好多时候不遵守交通规则,甚至出现逆行等问题。
所以我们综合考虑,最后一公里的无人化综合效益应该非常显著,而不仅仅是一个经济效益。
园区无人配送物流车的挑战
也许有人认为,我们选择低速载物就没有什么技术门槛。上图是我们在清华实地运营期间,遇到的一些非常典型的问题。
第一个问题就是 RTK,也就是差分 GPS 基本失效。因为两边的树非常多,这对我们激光定位或者视觉定位要求非常高。
第二,在园区内,目标交通行为非常复杂。比如有很多自行车、电动车在路上行驶,而且它可能事先是毫无任何特征,也没有什么手势之类就直接切入。对于自动驾驶小车来讲,我们需要进行非常准确的目标行为和轨迹预测,否则要么造成车辆猛刹车,要么造成撞人事故。
第三,园区内基本上没有交通秩序的约束。比如,逆行或是人在道路中间站着拍照这种场景应该是常态。这种场景我们并没有办法通过法律法规约束,这也是团队面临的非常严重的问题。
第四,行驶路径会有很多突发和偶然性的事故,比如,无人物流车行驶在一半的时候突然被一辆乱停乱放的车辆堵住通道,这时候物流车不仅需要重新规划路线,可能还涉及到调头、倒车等非常复杂的操作。
以上场景算法的复杂程度,其实已经远远高于高速自动驾驶。需要强调的是,我并不是说高速自动驾驶非常简单,它可能注重点不同,高速自动驾驶的算法可能非常简单,但要求每一项功能非常可靠,比如感知算法。
不幸的是,在我们目前测试的几个场景看,应该是一个常态,而且有一些场景远远比它还复杂。
最后一公里物流产品方案
作为最后一公里物流产品的方案,安全是我们的基本要求。
蜗必达产品在去年 11 月在内部立项,目前迭代到了 2.0 版本,1.0 的版本经过半年左右的研究,积累了许多问题。2.0 版本目前在功能和定义上面基本上比较完善。
今年 7 月,我们计划会有 10 台左右小批量的样车投入到实际运营中。经过下半年持续改进,而且在我们合作方强有力的推动之下,我们希望在今年年底达到 100 台的小批量运营。
我们认为 100 台是产品稳定成熟的标志性数字,从现在 1 台发展到 100 台的难度,远远大于从 100 台发展到 1 万台。
在底盘和执行器的设计上,我们充分考虑到实用性及可靠性问题。
我们采用车规级的电控底盘执行器、电池等提升性能,而不是采用现成玩具车的底盘改造。与国外某些送披萨的自动驾驶小车相比,我们根本区别在于我们真正将它看做是车而不是玩具。
比如,我们要充分考虑它的实用性,在重庆,我们需要考虑爬坡等问题。如果想多送几次货,我们要用大容量电池来提高它的行驶里程。目前我们的车能够跑 70 公里即完整运行一天是没有问题的。
在最关键的传感器以及计算单元选择上,我们充分考虑就是:如果量产,要考虑成本、供货周期以及销售服务等等。
因此,我们从一开始就立足于国产方案来确保我们后续的顺利量产。比如说这里最核心的激光雷达、GPS 和相机等等,我们都具有目前国内最好的供应商资源。
在计算单元里,我们也逐步从前期的英伟达 TX 系列方案,逐步过渡到国产 FPGA 方案。我们在计算单位里,通过 ARM+FPGA+MCU 的组合方式,能实现常规 CPU 运算,也能为后期深度学习等方式来进行扩展。
当然,车辆和传感器的硬件是蜗必达非常重要的基础,但它真正的灵魂,就是智行者的自动驾驶开发体系软件架构。
我们从平台、体系以及关键技术四个方面来归纳,实际上主要包括以下四个模块:
-
AVDC ,数据、采集和标注平台;
-
AVSIM ,仿真平台;
-
AVOS ,自动驾驶的操作系统;
-
AVTA ,自动驾驶算法测试及评估体系。
AVOS 设计思路及关键技术介绍
由于时间关系,以下我就 AVOS 以及其中的关键技术进行简单的介绍。
AVOS 并不是凭空臆造的,也不是纯粹去模仿写出来的,它是我们从前期项目演示中摸索出来的。从功能上讲,它主要解决的问题是我们算法与业务的功能:充分高内聚、低耦合。
高内聚、低耦合是一个软件工程名词,是指算法与业务在功能上高度依靠、环环相扣、非常严谨的,并不是多一个少一个的问题,而是代码上要充分的节耦,不能高度依赖。
基于 AVOS 框架,我们能够充分应付多种业务。
比如,我们要做高速自动驾驶车辆、扫地车、物流车等,如果没有考虑到这一点,就会出现所谓扫地车版本、物流车版本、乘用车版本、大卡车版本。后期造成的最大问题是难以维护,代码管理非常零乱。
所以,在 AVOS 内部架构,我们采用的是 ROS 作为框架,这主要是考虑到我们的用户,如果他自己想做开发,用 ROS 也会比较方便。
我们真正的核心层还是在 KERNEL 层——只负责一个非常纯粹的自动驾驶算法。在这个算法结构体系里没有任何的业务功能。
举一个例子,比如 KERNEL 层没有所谓的停车点,在哪儿上车或者在哪儿送货。我们认为这属于业务层,我们只做纯粹的自动驾驶算法研究。
AVOS 的设计有以下三个关键词:平台无关、功能抽象、认知虚拟。
平台无关,这里的「平台」不只是车辆硬件或者传感器,还包括任务,也就是我们要实现的两点:车辆层,传感器和硬件自适应,不能说换一台车后,我们的代码还需要修改,我们需要自适应;任务层是指我们开发了一个 AVOS Managenent 工具方便我们进行非常傻瓜式的操作。
功能抽象,这里的功能包括交通功能和业务功能这两块。交通功能,具有交通属性;业务功能就是车除了运动外,实际上还有工具属性,比如扫地车会扫地,物流车除了运动之外它是送货,它实际上是一个具有业务功能的交通工具。
AVOS 将交通及业务功能统一抽象为自动驾驶的算法功能。例如,在 AVOS 里,没有红绿灯的概念。
我们的做法是将红绿灯抽象为停车线前面有一个不可逾越的障碍物,通过这种方式来让自动驾驶算法实现在规定地点自动停车。
同样,在 AVOS 也没有业务层,没有送货店、载客店的概念,都会进行高度的抽象。
比如我要到 B 点停 5 秒钟,让所有乘客下去,这是一个业务层的描述。我们通过将这些业务层的描述转换到 AVOSKERNEL 能够理解的语言。
简单解释,比如通过用户在载客层点设置一个虚拟障碍物,它是不可逾越的,车辆同时也要在这里停车。那么这个不可逾越的障碍物可能就是保持 5 秒,保持 5 秒之后它就自动消失。
我描述得比较简单,实际在模型里不简单。通过这种业务的描述转化为功能的描述来进行抽象,我们在 AVOSKERNEL 里相当于没有任何业务的功能描述。
最后是认知虚拟,包括场景感知与情境认知。
场景感知就是算法,例如计算障碍物的位置以及速度等等。但人类在理解周围障碍物的行为以及它未来轨迹时,我们肯定不是简简单单通过前后两个这样去比较。
我们实际上要做到情境认知,要对一个连续时间、空间实体的交互影响来进行描述。这里涉及到非常复杂的模型。
AVOS 关键技术:高精度建图与定位
简单介绍我们两个非常细的关键技术,第一项是高精度地图构建以及定位。
这是蜗必达原型车在园区实际运行的状态,我们可以看到,这个园区还是蛮复杂的。
虽然路上没有多少行人,但可以看到周围有的花花草草,当它走到一个靠墙特别近的地方时,RTK 已经完全失效,在这种情况下主要是通过激光雷达进行精确定位。
这段视频的后半段呈现的是我们算法的定位效果。这里不仅是激光雷达定位,还包括一个非常便宜的惯导、轮速计和 RTK 等进行了融合定位。我们发现当 RTK 失效时,车辆非常稳定,没有出现漂移或者抖动。
AVOS 关键技术:目标行为及运动轨迹预测
第二项关键技术就是目标行为以及运动轨迹的预测。
在学术研究里,有很多种行为预测方法,当然通过深度学习也可以实现。但是实际上我们在做产品时,一定要考虑到:我们要尽可能利用一切工程化方法、先验知识来辅助来进行非常精确的定位。
这段视频有高精度地图,红色车辆是我们的自动驾驶车辆,绿色轨迹是目标行为预测的车辆,在左下角有视频来作参考。
在地图上,深蓝色的线是自动驾驶车辆绝对的行驶参考轨迹,我们在公司附近绘制了一张面积四平方公里大小的高精度地图,我们在上面标注了建筑物、栅栏等等。
回到切入车辆行为预测,其中四个点或者五个点代表的是,比如四个时刻、五个时刻一个车辆将要行驶到的一个全局的路径位置。
在视频中,我们可以看到这辆车一开始会有左转的趋势、有从右方切到左边的趋势,到这辆车又重置车道,最后又回归到右车道的趋势。
我们的行为预测都能够比较准确估计出来。有了这个行为预测后,我们再构建其他模型时就可以做到非常精确。
在视频后半段,汽车在十字路口右拐时,前车也要右转。我们从静止出发,因为静止的时候前车没有速度,我们也无法预测。如果它一旦有了速度,我们也能够精确预测出它右转做出的运动轨迹,然后我们再根据这个运动轨迹进行运动规划。
雷锋网版权文章,未经授权禁止转载。详情见。
原创文章,作者:kepupublish,如若转载,请注明出处:https://blog.ytso.com/113697.html