地平线自动驾驶商务总监李星宇:自动驾驶场景解决能力,比分级更重要
一直以来, 自动驾驶 、智能网联汽车都是整个行业的关注热点。对于自动驾驶该如何实现落地与商用?目前车企还需要哪些协助?自动驾驶已经取得了哪些进展?近日,亿欧汽车邀请了 地平线 公司的自动驾驶商务总监 李星宇 ,请他为我们介绍自动驾驶行业的最新趋势,以及对于行业趋势的看法和见解。
说到自动驾驶的技术路线, 当前主流玩家分为两派:第一派是以谷歌、百度为代表,使用激光雷达+高精地图的方式实现自动驾驶的科技企业;另外一派像奥迪及特斯拉这样的大型车厂,通过摄像头+导航地图以及其他辅助传感器实现自动驾驶。
这两种路线各有千秋。从第一种来看,激光雷达是目前为止我们能够得到的感知精度最高、可靠性最好的传感器。该模式采取了重感知轻计算的方式,企图通过传感器的高度可靠性与高精度来简化后续的计算任务及决策压力。而高精地图则可以看作隐形的传感器,为定位提供有力的支持。然而这种模式的不足在于其较高的成本,以及较低的可靠性。
像64线的激光雷达,其长期工作的可靠性、稳定性以及抗环境干扰的能力依然存在很多问题。高精地图也是一样,只有实时的3D高精地图才能完成一次可靠的自动驾驶。而一旦高精地图变得实时化,将面临非常高的成本。另外,激光雷达本身对于整车的外形设计而言也是一个很大的挑战。
那么,基于非激光雷达的方式,比如说摄像头再加上各种不同距离的毫米波雷达进行感知,以及精度相对没那么高的导航地图,这样的组合体现了一种“轻前方感知、重后方判断”的策略。该模式在成本上可以满足现在大规模量产车的需求,同时对于车辆的外形设计也更加友好。
(车载图像传感器进步巨大)
事实上很多人也在思考,是不是自动驾驶系统也可以像人类一样,仅凭视觉加上声觉辅助,就可以完成自动驾驶呢?如果对比图像传感器和人类的视觉能力来看,现在的图像传感器在物理性能上已经远远优于人类。形象地说,人类有效的视觉感知细胞折合成像素,大概不到110万像素。而现在的图像传感器最高可以达到3600万像素。
(视觉感知重要性持续提升)
图像传感器拥有最丰富的线性密度,其数据量远超其他类型的传感器。 我们曾与很多主机厂及大型Tier 1供应商进行沟通后得到的一致结论就是,基于视觉的感知在整个自动驾驶体系中的重要性正在持续提升。最开始,很多人认为视觉可靠性不够高,其实图像传感器正在不断扩展它的能力边界。基于图像信息密度最高的优势,使得它处于整个感知融合的中心地位。同时,随着L3这样的自动驾驶系统逐渐部署,越来越多的开发者意识到需要将感知从车外扩展至车内,对车内“人”的感知同样也是在视觉感知的基础上进行的。
当然,并不是说我们只需要依赖于图像传感器的视觉感知就能实现可靠的自动驾驶。视觉感知仍然有它的能力边界,多传感器的融合其实是商业化自动驾驶达到高可靠性的必由之路。
前面一直在谈图像传感器对于自动驾驶的重要性,那么,到底图像传感器可以实现什么具体功能呢? 主要是基于视觉的感知功能 ,比如说基于像素级别的场景分割,还包括对于各种在驾驶场景里面关键目标物的识别,像交通灯、交通标志牌以及移动目标的3D识别。
为什么要做到3D识别呢?作为移动主体来讲,我们需要判断其下一步的意图。3D的感知结果非常有利于我们对它的意图进行判断。我们的目标是通过对这样关键目标物的识别,对于整个驾驶场景进行语义级别的分割,最终重构一个3D的虚拟环境。
这些工作看似基础,但对于自动驾驶的意义至关重要。某报告指出,在自动驾驶路测过程中,需要人为介入进行干预的事故里面,大约有70%是由于没有正确识别交通灯造成的。而对于这种交通灯的识别,在没有V2X技术辅助的情况下,几乎唯一的方式就是通过视觉传感进行感知。
视觉感知在传感器融合方面,不仅仅处于中心地位,还扮演着监督者的角色。同时,在整个自动驾驶体系中,图像传感器的数量也越来越多。
对于自动驾驶来说,一个极具挑战性的难题在于如何实现非常可靠的高精度定位,这当中SLAM技术十分关键。 考虑到成本的可承受性,与基于激光雷达相比,基于视觉的SLAM成了重中之重。
视觉感知的另外一个关键应用在于特征物地图。 特征物地图是指,可以根据道路上的主要特征物,比如说路灯、交通标志牌等,去构建一张精简的语义地图。由于量非常小,大范围的精简语义地图都可以存储在本地。通过视觉感知的结果和特征物地图进行匹配,就可以做到一个基于视觉的定位。
(自动驾驶带来新的计算挑战)
随着图像传感器部署数量的迅速增加,以及图像传感器本身像素数的提升,对于图像的计算处理要求也越来越高,现在的自动驾驶系统需要有两个数量级的提升才能够满足需求。在数据生成速度方面,自动驾驶汽车的速度要超过手机四个数量级。就单机而言,其实自动驾驶已经超越手机,成为整个业界计算领域新的驱动力。
与此同时,在自动驾驶领域对于计算能力,也在性能方面提出了不同的要求。比如说,在可靠性、功能安全方面,需要其保证能够达到SU-D的级别。正因如此,我们看到全球整个计算供应业的领先者,基本都是all in自动驾驶的态势,无论是 英伟达 ,还是英特尔、高通。
(新一代AI解决方案:算法+处理器)
而深度学习网络对于计算平台的要求也远超之前传统的图像识别算法,在这样的背景下, 整个计算供应业,包括英伟达这样的巨头,在面对自动驾驶的计算需求时,都在朝着打造一个全新构架的计算平台前进。
从某种意义上来讲,自动驾驶的意义并不仅仅局限于交通领域。事实上,它已经成为整个 人工智能 行业发展的核心驱动力。
(专用AI处理器提供最高的能效比)
到底什么样的人工智能处理器最合适呢?评判一个计算平台的关键指标,并非简单对比其计算能力, 更要看它每瓦的性能、成本、以及是否构建了一个活跃的生态系统 ,能够让其中的各个玩家持续不断的共享。
(智能网联汽车示范区助推自动驾驶落地)
在政策环境方面,自动驾驶同样面临着进步与挑战。就自动驾驶产业的支持政策而言,有别于北美等地选择从法律法规方面入手,我国在主要城市建立了自动驾驶示范区。相对于出台相应法律,这种模式更加灵活高效,决策周期更短,有利于更快推进自动驾驶的落地。
综合来看,国内各家企业在自动驾驶商业化方面的尝试存在共同点。 通过渐进式的发展道路,限定速度、限定区域,逐渐扩展自动驾驶的适应边界。 限定速度的方式,比将功能进行分级来得更加有效、精准。
(如何应对自动驾驶商业化安全性挑战)
在自动驾驶商业化的商业模式尝试方面,也存在多种模式。许多自动驾驶初创公司开始使用BOT的模式提供自动驾驶服务,而非仅仅提供一个自动驾驶车辆。更重要的是, 自动驾驶落地的主流方式,还是同时对车端和产端进行改造。 产端的改造是指,对所在的封闭运行环境本身进行改造,比如说通过增加无线的传感节点,在视觉盲区内补充有益的信息,或者部署一个小的V2X示范区,都可以非常有效地提升视觉感知的可靠性。
另外一点就是产端中感知的加入,使得自动驾驶可以与云端服务打通,形成一个非常好的用户体验。 比如说在像停车场这样的应用场景下,调度中心可以自动分配一个空的车位给你,让车按照这样的指引通过自身路径规划完成停车。
毫无争议,V2X对自动驾驶的商业化落地来讲是至关重要的。与北美和欧洲不同的是, 我国在V2X方面首先落地的是V2I ,即路测的感知。至于我国对自动驾驶的官方术语“智能网联汽车”,“智能”是针对车端的,“网联”则是针对环境端的。显然,从政策层面来讲,国家会同步推进车端和产端的系统开发。可以说,产端和车端的关系就如塔台和飞机的关系。
有趣的是,业界许多造车的公司开始纷纷布局出行领域,出行公司也相继开始造车。 本质上讲,如果想要真正提供好的出行服务,需要同时掌握自己的设备与服务内容本身。 就像苹果,需要同时掌控硬件与应用程序市场,才能给用户打造一个良好的体验。
自动驾驶是一个非常庞大的主题,其商业化落地也是一个极具挑战性的话题。李星宇详细讲述了视觉方案在自动驾驶落地过程中扮演的作用、自动驾驶的算力、深度学习、产业政策等方面的趋势与最新进展。
在Q&A环节,李星宇对于部分听众关于自动驾驶的行业问题进行了解答:
Q:百度拟对外公开Apollo系统,其高管曾言,任何开发者都可以用Apollo组装出一辆自动驾驶的汽车。这对地平线等同业友商,会否带来竞争压力?
A:每一次谈到自动驾驶,百度的Apollo计划都是一个绕不开的热点话题。百度在Apollo生态方面的确做得非常棒,为大家提供了一个更加一致的学习平台。而谈及产品化方面,我认为现阶段我们并不需要去“发明轮子”,譬如通过激光雷达加高精技术打造一架自动驾驶汽车。而是努力以可以接受的成本、高可靠性的性能,推进自动驾驶系统的量产。
从这一意义上来讲,Apollo系统事实上提供了一个更好的开发环境,但其本身离量产还有很远的一段距离。Apollo系统里面使用的雷达和高精地图,这些东西直接量产化是不现实的。我们还需要基于这一基础做大量的优化,包括计算平台。
简而言之, Apollo系统给整个业界的友商提供了一个更好的平台 。大家在这一平台的基础上进行更高等级的博弈,但它绝不能替代各个厂商推进自动驾驶量产化开发的努力。
Q:目前,有一些公司声称要将自动驾驶技术“降维”使用,即用L4的技术,实现L3的功能。在你们看来,这种战略是否可行?现阶段实现L3自动驾驶的靠谱路径是什么?未来你们将如何向L4迈进?
A:迄今为止没有任何人能明确什么是L4的技术,我将这个问题理解为“使用更高等级的可靠性和性能,去实现一个相对较低的需求”。我们没有办法简单地判断这一战略是否可行,现在所有自动驾驶的商业化时间都是面向场景的,而这些场景我们很难去区分到底是L3还是L4。
比如说在矿区,就要求在这样的封闭环境中的每一个点上都能做到自动驾驶,这到底属于L3还是L4呢? 其实定义自动驾驶级别并不重要,重要的是你是否能够为客户在这样的一个场景下解决他的业务需求。
对于每一个专注于自动驾驶的开发或是商业化落地的同行来讲,大家更应该关注的是能不能解决某一特定商业场景下的问题,能不能通过对这一问题的解决,让客户在投入和产出方面达到一个有吸引力的水准,这可能比单纯去区分L3或是L4更有意义。
Q:既然视觉方案和激光雷达方案各有利弊,目前有没有视觉+激光雷达的融合方案?其融合方案的主要挑战是什么?
A:目前从各个主机厂的开发态势来看,他们倾向于认为在成本可以接受的情况下,尽量选择低像素的激光雷达,进行自动驾驶的视觉感知。与32线或64线的激光雷达相比,低像素激光雷达在成本方面有巨大的优势。
目前市面上对于视觉+激光雷达的融合方案已有应用,比如奥迪的A8车型就配备了法雷奥的激光雷达,但这个激光雷达是4线的,因此成本比64线雷达低得多。但由于线束密度相对较低,因此无法像像64线激光雷达那样,对整个环境进行感知,更多的是集中于某一个方向,进行关键的环境感知的补充。比如说在前置方向上,探索正前方的障碍物是否存在。
目前该融合方案最主要的挑战即在于成本 ,如果成本降下来,线束密度肯定是越高越好。
Q:如今,谈到人工智能芯片,英伟达是最吸引眼球的公司。地平线推出的自动驾驶处理器和英伟达的自动驾驶平台有和不同呢?相比之下,地平线的优势有哪些?
A:英伟达的计算平台有非常强的性能,这是一个不争的事实。然而在这样的性能背后,其付出的代价是惊人的功耗以及相对惊人的成本。而这对于在成本方面十分敏感的汽车行业来讲,成为了导入量产化方面的巨大障碍。地平线的人工智能处理器在这一方面加以平衡,性能满足场景需求的同时,也将功耗和成本控制在较低水平。
第二个优势在于,地平线同时打造自己的芯片及算法。只有把软件和硬件协同设计,才能达到性能的最优化。比起其他厂商来讲,这种同时开发的策略在效率上有非常明显的优势,不需要等英伟达出了最新的计算平台之后,才开始在这个计算平台上进行算法的开发。而是从一开始就平行推进算法,以及计算构架的协同设计,我认为这是一个巨大的优势。
【垂直行业峰会来袭!】11月3日,亿欧将在上海虹桥元一希尔顿酒店举办 “汽车消费新模式——GIIS·2017汽车新零售商业峰会” ,聚焦当下行业热议的以租代购(LEASE)、汽车消费金融、汽车超市、新车B2B/B2C交易、渠道下沉等话题,为莅临参会的各地渠道方(SP)、从业者等专业观众提供一场产业盛会。
版权声明
凡来源为亿欧网的内容,其版权均属北京亿欧网盟科技有限公司所有。文章内容系作者个人观点,不代表亿欧对观点赞同或支持。