如何打造自动驾驶计算中枢?地平线车规级AI处理器背后的“秘密” | 2018 全球智能驾驶峰会

如何打造自动驾驶计算中枢?地平线车规级AI处理器背后的“秘密” | 2018 全球智能驾驶峰会

*地平线(上海)芯片研发总经理吴征

雷锋网新智驾按:10 月 26 日至 27 日,2018 全球智能驾驶峰会在苏州召开,本次峰会由苏州市相城区人民政府主办,苏州高铁新城管理委员会、雷锋网(公众号:雷锋网)新智驾和数域承办,邀请到来自主机厂、科技公司、资本机构和产业研究机构等领域的多位专家,共同打造了一场智能汽车和自动驾驶领域的顶级峰会。

本次峰会上,地平线(上海)芯片研发总经理吴征发表了题为《车规级AI处理器—打造自动驾驶计算中枢》的主题演讲。吴征博士曾在三星半导体、矽玛特、飞思卡尔和摩托罗拉等多家跨国公司担任中国区高管职位。吴征博士从事芯片/半导体行业超过二十年,近期加入地平线,负责研发自动驾驶的AI车规级处理器。这也是吴征博士加入地平线以来的第一次公开演讲。以下为吴征演讲全文,雷锋网(公众号:雷锋网)新智驾进行了不改变原意的编辑(略有删减):

地平线是一家什么样的公司?

如今我们已进入一个大数据时代,无论是人们在淘宝、京东网上购物,或使用手机上网、拍照,或在市区里开车“一不小心”被拍……生活中无时无刻不在产生大量的数据。日积月累的数据量非常庞大,但多数情况下,众多貌似是重复性的、无用的数据被搁置在旁,真正使用时又非常困难。

如何将大量的无用数据转化成有用数据,挖掘其背后的价值?这是一个很大的挑战。这涉及到如何有效地进行数据处理,本质上看,这是一大计算问题。

AI作为一种的关键技术,它基于大数据进行训练和推理,可将无用数据进行“识别”, 把非结构化数据转化成结构化数据,提取有用的信息。首先,我们来回顾一下近几年AI计算芯片的发展:

  • 英特尔的CPU传统架构,在处理大量数据方面显得效率不高,算力不足;

  • 后来,英伟达的GPU被应用,其计算能力强,性能强大,但也有局限性,比如功耗高,成本贵;

  • 最近几年,FPGA盛行,其架构适合CNN计算,能耗比高,现场可编程适合各种场景,但对一般开发者来说,其开发较难;当大规模量产时,成本、功耗也比较高。

最近几年,一些平台公司,例如Google,本质上是一家软件互联网公司,亦开始拥抱硬件,甚至进军芯片。很重要的一点是,庞大的数据量需要有效处理。目前越来越多的公司开始考虑软硬件融合,打造生态圈。

作为一家技术驱动型的公司,有着强大人工智能算法的地平线,自成立即定位于一家软硬件结合的公司, 其核心是要打造自己的BPU (Brain Processing Unit)芯片,类似于 Google 的TPU。地平线瞄准的是嵌入式AI 芯片,应用在物联网方面的终端产品,节点和控制设备, 专注于边缘计算。这与研发服务器,云端AI芯片不同, 前者计算性能更强大,同时功耗和成本也是需要考虑的问题。

AI计算技术与应用场景高度相关。以人脸识别和自动驾驶环境识别为例,其训练、推理及算法不同。 在一定程度上可以理解为:场景决定算法,算法决定芯片。反之,芯片又要求有算法,只有软硬件接合,提供解决方案应用到场景才能最终解决问题,这是一个闭环系统。

2015年成立之初,地平线确定专攻AI嵌入式芯片,当年9月开始研发BPU;这期间地平线也在发力FPGA,同英特尔合作开发ADAS系统;去年6月,地平第一代AI芯片(BPU)流片,并在去年年底发布了第一代AI芯片“征程”和“旭日”。地平线BPU架构正在不断完善,性能更强,于今年初发布基于BPU第二代架构的Matrix视觉感知方案,并在CES上进行公开实车Road Show。今年地平线两款芯片已经开始量产。

今年底,地平线将完成新一轮融资,金额为5-10亿美元,投资方包括一家和英特尔规模相当的芯片公司,以及一家知名汽车厂商。

以BPU为核心,地平线提供的是一整套软硬件综合解决方案,包括芯片,算法,编译器和运行时库,以及训练仿真的综合平台。业务覆盖三大领域:智能驾驶、智慧城市、智慧零售。

车规级AI处理器

算力是智能驾驶芯片的核心问题,地平线专注于视觉感知领域。

车规级AI处理器的研发目前面临几大挑战:强大的计算能力,可靠性,功能安全,和质量管理与长周期的支持体系。

目前一辆汽车大多装载多个摄像头,每个摄像头或720P,或1080P,每秒30帧。未来车身上会有越来越多的摄像头,6个、8个甚至12个,逐渐升级的分辨率,为自动驾驶带来的是巨大的数据处理量。另外一方面,基于神经元网路的AI计算量也是巨大的。

就目前看来,面向L2、L3级自动驾驶处理器的算力要求达到数十个TOPS,L4到L5级将达到数百,甚至千TOPS级的要求。

不同于用在一般消费产品方面的芯片,用于汽车方面的半导体面临的环境更严苛,对可靠性要求高。感知决策关系着汽车与人身安全,所以对功能安全要求更高。

一款芯片从芯片定义,设计,流片,测试和验证,到获得车规级认证需要花费很长的时间。另一方面,汽车芯片进入供应商或主机厂,从导入设计到设计采纳,一轮轮测试与验证,一款芯片与OEM磨合成功,并实现真正量产至少需要3-5年。这是一笔很大的投入。而且,汽车上的MCU、信息娱乐等芯片目前并没有中国品牌的身影,可见应用到汽车方面的半导体芯片的门槛非常高。

应用于汽车方面的芯片或车规级芯片与消费级芯片不同,可从以下几个维度进行对比:

  • 温度方面:消费级芯片使用温度一般在0°—70°;工业级半导体使用温度更宽一点;在汽车上,温度需要低至-40°,高温要到105度到125°;

  • 从使用周期来看:消费型半导体为1—3年,而一辆汽车的寿命至少为10—15年;

  • 从现场失效率来说,消费等级的是小于10%, 而汽车芯片的目标要求为零失效率。

值得一提的是,汽车半导体需要通过AEC-Q100认证。在质量认证方面,除零失效率,汽车半导体产商还需经过TS16949质量管理认证和10年以上的支撑体系。

另外,和安全相关的芯片应用到汽车上,需经过功能安全认证,来保证安全护航。这是值得重视的一点。

为什么功能安全认证如此关键?

和手机相同,电子信息化比重越来越大的汽车可以看作为是一个复杂的嵌入系统,无法做到尽善尽美,失效是不可避免的,一般分为两种情况:

  • 系统失效,或因产品的系统规格不完善,或因硬件芯片设计或软件开发中的“错误”;

  • 随机失效,这或是个永久性错误,例如汽车的老化效应造成电路某处连接出现问题,或者是瞬态错误,例如某一瞬间的电干扰。所以参局者需要遵从业界最好规范来减少这些系统失效的风险,实施安全机制来减少随机失效的风险。

功能安全对应汽车方面即ISO26262标准。这是一整套流程,即从需求,开发,验证到认证,从IP,EDA工具到芯片设计,从硬件到软件,系统均有规范,形成一套完整的功能安全体系。面向量产的芯片需经过认证达到一定ASIL等级,例如和ABS,EPS相关的芯片必须达到ASIL-D等级。

接下来,再看面向自动驾驶的AI处理器如何满足强大算力的需求。

传统的冯诺依曼架构已无法满足深度学习的计算要求,地平线自主创新的BPU,是一种多指令多数据MIMD架构,其能够满足数据流的计算要求,实现灵活的数据分发和计算的并发异步处理,并对CNN计算中关键的乘加运算(MAC)单元达到很高的利用率,所以地平线BUP的每瓦TOPS性能相当突出。

地平线车规级AI处理器芯片的最新进程

地平线BPU于去年发布的第一代高斯架构,到目前的第二代基于伯努利架构,均采用新型稀疏二值化神经网络结构,可支持更多路视频输入,支持多传感器融合,目前主要集中在感知领域,后期将进行定位,建模,预测,路径规划到最终决策。

地平线面向智能驾驶的BPU和Matrix视觉感知系统,已经向欧美汽车厂商交付。BPU 2.0可以实现多路摄像头、多场景融合,能效更佳,  可在30W的功耗下实现基于像素级的图像识别分割,可识别人、牌照、车型、交通红绿灯、路标、障碍物等等。

地平线目前的第二代车规级AI芯片,已进入最后的开发阶段。与第一代不同,前者从方框级的识别精确到像素级的语义识别。

总体来看,基于自动驾驶,地平线打造的是车规级AI处理器或SoC,提供相关的软件算法,核心编译器、运行时库,训练,工具链一整套的平台和整体解决方案。

最后,以地平线量产的两款芯片名字来结尾,用于智能IPC的旭日(Sunrise)和用于智能驾驶的征程(Journey)。在地平线看来,自动驾驶目前正在蓬勃发展阶段,但未来的发展依旧面临挑战,无论是商业大规模落地还是技术实现方面。但这是一段美好的征程,我们将像AI的深度学习一样,不断的学习,不断的进步,攀登一座又一座的高峰,最终达到幸福的彼岸。

原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/130573.html

(0)
上一篇 2021年8月31日
下一篇 2021年8月31日

相关推荐

发表回复

登录后才能评论