“硅谷钢铁侠”惹众怒:激光雷达到底配不配做无人车的“眼睛”?
文|脑极体
热衷于“拉仇恨值”的马斯克前不久再一次不负众望,给我们贡献了四月的最后一瓜——激光雷达傻瓜论。
坊间流传一个说法:激光雷达就是自动驾驶的“眼睛”,换句话说,凡是想搞自动驾驶的厂商,必须先拜激光雷达这个“山头”。
不过,在4月24日的“Autonomy Day”产品发布会上,怼天怼地怼空气的马斯克就将炮火对准了激光雷达。
原话是这么说的,“Lidar is a fool’s errand”,傻子才用激光雷达,现在谁(做自动驾驶)还要靠激光雷达,那就注定完蛋!不信走着瞧!
言辞之激烈,内容之放肆,放在“狂言人设”的马斯克身上,都有些令人惊讶了。于是乎,一夜之间,AI圈、汽车圈、朋友圈都炸了。各路大佬纷纷下场,从技术争论吵到人品讽刺,要多热闹有多热闹,媒体群里也洋溢着欢乐的气氛:头条稳了!
马斯克用一周的时间,如同葫芦娃一样为大家贡献了“一根藤上七个瓜”。
“做车一族”集体diss马斯克的观点,驭势科技、文远知行、Autowise等出行企业,以及Velodyne等激光雷达企业的重要负责人,都旗帜鲜明地表示,自动驾驶想要完全摆脱激光雷达,根本不可能。
但马斯克本人并不孤单,很快科技撰稿人Steve Cheney就出来声援,认为“三年内所有明智的人都会抛弃激光雷达”,理由也和马斯克一样,因为(激光雷达)“没有必要且非常昂贵”。
不得不说,双方大佬的观点都是一些……老生常谈。其实,关于自动驾驶的实现到底是靠激光雷达还是摄像头,这个话题早已争论多年了。
更令我们感兴趣的是,“激光雷达傻瓜论”出现在当下这个时间节点,或许并非偶然。其背后隐含的是自动驾驶汽车长期以来未能解决的痼疾,也确实到了该重新思考方向的时候。
今天我们就用一篇文章帮大家捋捋清楚,当大佬们谈论激光雷达时,究竟在谈些什么?
当众diss激光雷达?马斯克表示:坐下,常规操作!
吃瓜之前,咱们先捋一捋,自动驾驶与激光雷达之间的紧密关系:
如果我们要做一台自动驾驶车,那么需要完成几个必需而关键步骤:首先是感知,即获取外界的信息,然后判断,主要依赖云端算法,最后做出决策,该停时停,该走时走。
由此可见,感知阶段是自动驾驶汽车性能最基本、最重要的信息来源和体验保障。而目前主流的感知方式,则是依靠雷达,摄像头和激光雷达这三大传感器系统实现。
这三种方式各有利弊,其中“激光雷达”是一直是产业界关注的焦点。原因也很简单,激光雷达具有雷达的测距能力,但分辨率又比雷达高;具有摄像头的感知能力,但又可以不受光线条件的限制。它唯一的缺点是,造价太高,无法大规模地使用在量产车上。
在过去的几年间,几乎所有自动驾驶厂商都无法回避激光雷达。区别只是在于,谁能让这三者的排列组合更高效、更精准、更便宜。比如丰田TRI 研究院打造的无人驾驶汽车,就在车身上武装了7个Velodyne 的激光雷达。而谷歌自动驾驶公司Waymo独立之后做的第一件事,就是努力将激光雷达的成本暴跌,从原来7万美元干到了7500美元。
与行业对激光雷达的追捧相比,马斯克是个十足的异类。
他坚持认为使用激光雷达是一个错误的选择,在目前的智能驾驶量产汽车中,只靠摄像头的仅特斯拉一家。这至少说明,马斯克不是“口嫌体正直”,而是发自内心地认为激光雷达对自动驾驶的未来毫无价值。
说到这里,“课代表”来给大家总结一下,“倒雷派”(diss激光雷达的一部分人)的几个重要论点:
1.激光雷达成本太高。由于激光雷达的“不可取代”性,相应的价格也十分高昂,这就导致汽车厂商和芯片公司都很难在激光雷达的前提下实现盈利。
那么为何不考虑降低成本呢?目前激光雷达市场主要是靠汽车行业在支撑,短期内几乎不可能出现新的大规模需求,机械式激光雷达的生产组装效率也无法迅速提升,边际成本自然居高不下。
而有的企业为了降低整车价格,采用了更便宜的固态激光雷达,但也带来了新的问题,那就是这种雷达无法360度转动,不能探测背后的情况,还需要引入新的传感器,在经济效应上并不可行。
2.激光雷达实际应用中有bug。一个是由于不能识别颜色,导致激光雷达无法完成跟踪目标等任务;同时,激光雷达在高速移动中要处理的信号越多,海量像素会对广电探测器带来干扰,造成识别进度下降;此外,激光雷达需要额外插入外部适配器进行充电,使用上更加繁琐。
3.更关键的是,以激光雷达为提升汽车感知能力的捷径,也催生了科技公司和汽车厂商的“懒惰”。主要体现在高级自动驾驶方案上过分依赖和堆砌激光雷达,使得他们或多或少地回避了对自动驾驶来说至关重要的视觉识别算法和芯片基本问题。换句话说,激光雷达不但不能解决实际问题,还有可能让创业者们陷入盲目堆砌资源的资金战。
是不是听起来还很好道理的样子?试想一下,如果去掉激光雷达,全面引入视觉识别算法和高性能计算硬件,这样不就节省下来了大笔的激光雷达部署费用。对于自动驾驶厂商和跃跃欲试的潜在车主们来说,无疑是个福音。
也确实有公司这么干了。除了特斯拉之外,创业公司AutoX就让一辆只搭载 7 个摄像头的林肯 MKZ在无人驾驶状态下泡上了普通车道。
但是,更多的车企和无人驾驶技术公司之所以一边吐槽着激光雷达高昂的价格和“业务能力”,一边还不得不日以继夜地研究着怎么才能让激光雷达能更好用一丢丢。
这当然不是因为他们自带“抖M”体质,而是相比其他技术解决方案来说,以激光雷达为主已经是当时能找到的最优解了。
你行你上:视觉算法能扛起大王旗吗?
大会上,特斯拉人工智能高级主管Andrej Karpathy是这样说的——我们人类开车,都是完全视觉驱动,为啥到机器就非激光雷达不可了呢?
这也是特斯拉的另一种技术实现思路:通过多摄像头方案采集数据,再借助还原实际环境的模拟器来训练神经网络,通过智能视觉实现车辆对交通道路状况的“认知”。
特斯拉现场公布了一组数据,其全视觉感知的方案,已经能处理99.999%的场景。每天特斯拉汽车会发生10万起车道变更,没有发生任何交通事故。
并且,使用这一仿真视觉模拟系统的用户越多,神经网络的性能也就越好,特斯拉预测并处理交通状况也就会越熟练。
当然,特斯拉并不是将3D图像处理的训练工作全部交给了用户来说,围绕算法做了许多重要的工作,比如通过软件算法来让图像数据变得更加健壮,从而实现对图像的深度感知。
为了保障算法在无人车终端的运行效率,特斯拉还打造了全自动驾驶硬件。然而尽管做了一系列的准备工作,还砍了激光雷达一刀“祭天”,但马斯克的摄像头“视觉感知”理想,真的靠谱么?
至少在一部分坚定的“挺雷派”眼中,是不能接受的。他们反驳的理由也并非毫无根据:
首先,坚持采用摄像头做感知器的特斯拉,此前的事故率就已经啪啪打脸了。特斯拉官方公布的2019年第一季度数据显示,使用Autopilot自动驾驶的事故数量就比以往有所增加。每行驶287万英里,就会发生一起事故。相关车祸新闻报道近年来更是新闻媒体和电视台的常客。
更关键的是,以摄像头+视觉感知技术+芯片的技术矩阵,并未能带来令人惊喜的效果。举个例子,特斯拉的Autopilot已经是目前各家辅助驾驶功能里面最好的了,但就是这样的系统,也会每隔几分钟就要提醒人工进行干预,一些曲率大一点的道路弯口都会犹豫不决直接停摆。在一些特殊的天气环境中,单一的摄像头传感器系统更是捉襟见肘。
关于这一点,有网友在Hacker News上现身说法:几周前芝加哥下雪了,我的AutoPilot关闭了,因为大雪遮住了摄像头。所以我不会买这些“没有激光雷达的自动驾驶”。
这种情况下,真的很难令人相信,3D视觉感知技术已经成熟到了可以完全抛弃激光雷达的程度。
以康奈尔大学最新的论文成果来看,伪激光雷达的 3D 深度表示,比此前最优图像方法的识别准确率提升了2倍,在KITTI 3D 目标检测排行榜上达到了当前的最高水平,但也仅仅只是把立体摄像机系统和激光雷达系统之间的性能差距缩减了一半。
而对于成熟的汽车厂商和科技出行公司来说,他们需要面临市场和用户的重重考验,以及政府监管与公共安全的基本约束,需要最大限度地保证无人车的稳定和准确。反馈到大众层面, “激光雷达”已经成了一个必不可少的存在,哪怕只是作为甩锅道具或者安慰剂。
所以说,如果关于这场“激光雷达傻瓜论”一定要争出个所以然来,那么结果很显然是,无论是产业界还是学术界,都在传递一个清晰的信号:短时期内,指望摄像头+视觉系统没戏,激光雷达还是必需且必要的。
既然如此,大佬们是不是都有点闲得慌了啊,放着那么多问题不去解决,光顾着打嘴架了?目前看来,这场争论最大的意义在于,消解了激光雷达长期以来神圣不可动摇的产业意义,并试图寻找新的解决方向。
硬or软or软硬兼施:自动驾驶的未来由谁做主?
马斯克此时站出来反对激光雷达,固然有些激进,但或许也指出了上一个阶段自动驾驶厂商身上那件“皇帝的新衣”,确实不适合继续穿着了。
关于这一点,也有不少产业界人士表示赞同。
比如驭势科技创始人兼CEO吴甘沙就认为,完全不用激光雷达一定是有问题的,在相当长的一段时间内纯视觉方案的鲁棒性一定是不如视觉加激光融合方案的。但从更长的维度来看,靠激光雷达确实没前途,因为摄像头视觉能够有更丰富的维度去理解这个世界。
部分高精地图创业公司也强调从成本出发,采用低成本的摄像头方案采集高精数据。
喧哗声中,一场关于硬件和软件的主导权之争已经悄然拉开了序幕。
想要理解这一点,我们将视角方的更全面一点,来看看除了diss激光雷达之外,特斯拉还同时搞了哪些事情?
其一,是发布了性能强大的全自动驾驶硬件Hardware 3.0,每套HW3.0含2套FSD硬件,能够处理高达每秒2.5千兆像素和36.8 TOPS,据说浮点运算能力是英伟达Drive Xavier的7倍。
值得注意的是,FSD只运行特斯拉加密过的软件,非特斯拉软件,概不支持。
马斯克还很拉仇恨地表示,“特斯拉从没有设计过芯片,怎么一下子就能搞出全世界最好的芯片呢?但它就这样发生了”。
其二,是虚拟仿真系统。
基于大规模量产的特斯拉电动车(50 万台,并且还在快速增长),特斯拉拥有了训练神经网络的关键资源。
比如说,如果特斯拉解决不了车上架着自行车这样的难题(因为会被系统识别成两个物体),就会下命令让汽车将“问题”图片上传到总部,特斯拉对这些图片进行标记,再导入神经网络中继续训练,直到视觉系统能够熟练地掌握识别技能。
比如只通过雷达和摄像头,只要两者得出的距离相匹配,神经网络就能估算出车辆的间距。
从这个角度看,特斯拉的野心并不是给整个行业投出一颗重磅炸弹,而是构建出软硬件一体化的自动驾驶解决方案。
在底层技术上,特斯拉通过自主研发的高性能AI芯片,来了一个底层硬件的“弯道超车”,解决了对于算力的迫切需求,同时摆脱了供应商的限制,最大程度地将核心零部件主动权把握在自己手里。
在软性的技术壁垒上,特斯拉也在变得更强。算法上,特斯拉拥有以实景数据为载体的神经网络训练平台,同时坐拥实时生成的海量细节数据。
至此,拿出软硬件一体化解决方案的特斯拉,再一次与同行们拉开了竞争差距。同时也摆好了姿态,以一种软硬兼施的方式,吸引更多伙伴加入自己的阵营。
这场论战虽然是以“挑衅”开头,也离不开营销炒作的一贯手笔。但也同时让人们看清楚一件事,如同汽车没有被发明的年代,人类只想要一辆更快的马车。
当自动驾驶来到产业的冷静期,技术的快速迭代与生存的如履薄冰,使得厂商们不得不时时惊惶。但沉浸在这种“技术恐慌”之中,也容易忘记,人类需要的是发明汽车,而不是建造跑的更快的马车。
从这个意义上讲,特斯拉的自动驾驶帝国正在以最具创造性和颠覆性的样式成型。过分惹眼的装饰物背后,已经隐隐显露出了未来的冰山一角。
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App