低于单颗一千美金的单板计算设备AI 芯片即可实现 L4 级自动驾驶的实时控制
自动驾驶作为一个热门概念,已经风靡多年。但实际上,目前所谓的自动驾驶只是在L2级和L3级这个水平上,距离真正的自动驾驶——L4以上,还有不小的距离。阻碍自动驾驶真正走进大众生活的,除了技术成熟之外,还有成本的限制。
所有先进的技术从研发成功到大规模应用,面临的一个重要难点就在于成本的降低。一旦解决了成本问题,市场就会爆发。计算机技术产生于上世纪四五十年代,到了上世纪七八十年代,PC机成本低廉,计算机才真正走进千家万户。
目前正在生产的自动驾驶 汽车 仍然非常昂贵,一个实验模型就可能需要花费大约 30 万美元(将近大约 200 万人民币)。其最昂贵的组件之一就是搭载执行自动驾驶软件系统的硬件,比如,百度的自主驾驶平台由两个计算系统组成,费用高达 3 万美元。大体上实现L4自动驾驶的硬件设备一般包含:6~12台摄像头、3~12台毫米波雷达、5台以内的激光雷达以及1~2台GNSS/IMU和1~2台计算平台(不同方案会选择不同侧重的传感器)。当前一整套L4级自动驾驶系统硬件成本还比较昂贵,整体基本在50万元左右甚至更高。其中最昂贵的组件之一就是搭载执行自动驾驶软件系统的硬件,花费动辄上万美元比如,百度的自主驾驶平台由两个计算系统组成,费用高达 3 万美元。
(L4 级自动驾驶汽车工作流程的高级结构)
高昂的价格,让许多对自动驾驶汽车感兴趣的用户望而却步。但随着资本和研发的投入,自动驾驶技术有望不断降低价格。一旦价格降低到20万乃至10万元,自动驾驶汽车市场势必爆发。
近日,人工智能公司CoCoPIE发布了令人振奋的科研成果,可以大大降低自动驾驶技术的成本。人工智能公司CoCoPIE首次证明,在满足所有延迟和准确度要求的同时,只需单个低于一千美元的现成处理器芯片 (NVIDIA Jetson AGX Xavier) ,即可运行 6 个来自 Autoware 的工业级 L4 级自动驾驶应用程序,而不是此前的一万美金。
单卡实现实时 L4 级别自动驾驶的缺陷及解决方案
CoCoPIE将这一成果通过论文形式做了发表,该论文所述的实验使用Nvidia Jetson AGX Xavier处理器运行L4级别的自动驾驶。
论文
研究人员首先在Jetson AGX Xavier 上对 Autoware 的六组算法进行了测试、观察和分析。在实际的应用中,这六组算法是共享的,他们之间的差异在于2-D感知组成部分。感知是自主驾驶软件的性能瓶颈; 其他组件的变化可能会影响用于车辆的推荐行动,但对软件的端到端性能没有可观察的影响,而性能是本次研究的核心。
【来自 Autoware 自动驾驶应用程序(ADApp)中的详细任务。感测(蓝色),感知(红色),定位(灰色),跟踪(紫色),预测(绿色),规划(黄色)和最终控制输出(橙色)。】
在探索的过程中,他们发现了 3 个主要缺陷,并针对性地给出了解决方案。
• 缺陷 1:当预先调度方案应用于部署到单个低端设备的自动驾驶应用程序时,会产生计算资源的紧缺。
- 解决方案:文章提出了一个简单的解决方案——即时优先级调整(just-in-time priority adjustment),通过即时调整任务的关联和优先级来解决「算力饥饿」。
• 缺陷 2:由于硬件模型设计和实现的某些原因,某些加速器未被完全利用。
- 解决方案:文章采用一种硬件感知模型定制(hardware-aware model customization)的方法,通过弥合DNN模型与多种类型的加速器之间的差距,显着提高了加速器的利用。
• 缺陷 3:当前的自动驾驶调度算法无法处理可以使用多种类型加速器的混合工作负载。
- 解决方案:我们提出了基于 DAG 实例化的调度(instantiation based scheduling),一种通过基于加速器的 DAG 实例化扩展自动驾驶调度以满足需求的方法。
实验证实:人工智能公司CoCoPIE成功地在一千美金级别的现有通用设备Off-the-Shelf处理器芯片上实现L4级别自动驾驶。在此前,L4级别的自动驾驶只能在上万美金级别的AI定制化设备处理器芯片上实现。
一般而言,在Nvidia的全套产品线中,ORIN或Pegasus是为自动驾驶汽车提供算力的系列,上述三个系列的计算能力、应用场景及功耗对比如下:
-> NVIDIA DRIVE Orin:254TOPS / L2+级自动驾驶 / 130 W
-> NVIDIA DRIVE AGX Pegasus:320TOPS / L4级自动驾驶 / 500W(一万美元芯片)
-> NVIDIA Jetson AGX Xavier:32TOPs / AI驱动的自主机器 / 10W)(CoCoPIE一千美元芯片)
也就是说,CoCoPIE用约为1/10的计算能力及至优1/50的功耗即可达到与高端芯片相同的应用效果,在实验所涉及的6个自动驾驶任务中,计算准确率及时延均满足L4级别自动驾驶的要求。
打开自动驾驶新局面
该研究颠覆了业界对L4级别自动驾驶所需计算资源的普遍认识,为行业降低成本指出了一条可行道路,并提出了一些重新思考自动驾驶的软件架构、设计和优化的研究机会,对解决当下汽车行业芯片荒问题亦有帮助。
除此以外,他们的研究还针对当前自动驾驶行业实践中的重要技术缺陷给出了一系列关键见解,并提供了几个实用的解决方案。这一结果颠覆了业界的一些普遍看法,并为该行业在迅速降低自主驾驶的成本和功耗上指出了有希望的道路。
CoCoPIE CTO慎熙鹏表示,对于自动驾驶来说,它的软件是相当复杂的,它的需要的算力,需要的运算量是非常庞大的,再加上需要实时速度,现在需要在上万美元的高端机器上才能运行起来,我们的突破点就在于是首次实现了把L4级自动驾驶控制软件,在一个非常低端、少于1000美金的一个小的机器上能够运行起来,而且能够达到实时的效果,同时不会在准确度方面有任何的损失。这将大大缩小自动驾驶的成本,惠及广大普通消费者。
单个颗一千美金AI 设备芯片即可实现 L4自动驾驶的实时控制 级自动驾驶,这一新技术正在加快 商业 化普及。CoCoPIE CTO慎熙鹏透露,CoCoPIE正在与自动驾驶初创公司PerceptIn进行合作,尽快推动CoCoPIE的技术能在PerceptIn的系统中跑起来。