专访Pony.ai 楼天城:自动驾驶已经走过了“从0到1”,“规模”是行业的分水岭
新智驾注:图片来自Slush Shanghai 2018
在过去的很长一段时间里,L4 级自动驾驶受到资本和自动驾驶研发商追捧,甚至很多公司将全自动驾驶作为开发目标。时过境迁,如今他们中很多都走上了 ADAS(L2)的开发之路,更加强调自动驾驶技术的商业化落地。
作为L4级自动驾驶创业公司当中的独角兽代表,Pony.ai 并不担心业界的冷静会打击公司的发展。相反,Pony.ai 的联合创始人兼CTO楼天城认为,自动驾驶行业当中几个关键的公司,是一定能够活到最后。为了能把这件“事情”做成,Pony.ai 可以付出很多,并不是受限于外部环境的冷热。
成立满两年之际,Pony.ai 仍然专注于L4级自动驾驶的技术难题。对于一个七万亿的出行市场,一个初创公司要具备什么技术实力和运营能力才能渗透进入其中,这是一个值得深思的话题。在L4级自动驾驶越发冷静的时候,瞄准Robo-taxi 赛道下的公司如何应该赢得时间和资本的信心?
在不断变化的内外环境前,独角兽 Pony.ai 的战事要如何继续进行?Pony.ai的联合创始人兼CTO楼天城来解答这一疑问。
年少成名的“教主”
楼天城,是首届百度之星程序大赛的冠军,因编程功夫了得,江湖人称“教主”。成名于编程,真正让这位天才少年大放异彩的是自动驾驶领域。
早在百度之前,楼天城的自动驾驶历程最早开始于2012年,彼时,楼天城加入谷歌Project X,那是一个楼天城认为和自我气质(极客)相吻合的项目,也是楼天城在谷歌花了一年时间所寻找到的项目。
楼天城对雷锋网 (公众号:雷锋网) 新智驾说:“项目的方式吸引了我”。自动驾驶是一个技术决定型的项目,这是一件非常难得的事情。很多项目其实并不是以技术为绝对主导的,比如手机并不是技术决定型项目,因为手机的用户体验非常重要;再比如,滴滴也是一类跟运营强相关的项目。唯独自动驾驶在未来的十年内将是技术决定型的项目,这对我是最有吸引力的。
在谷歌期间,楼天城先后涉及了自动驾驶的决策、控制板块,也做了地图、预测、仿真等技术板块,逐渐覆盖软件层的全链条。在这个过程当中,楼天城充分地认识了自动驾驶系统的稳定性和可扩展性的重要,而这些性能得以实现的前提就是需要好的底层框架。这也是为什么后来Pony.ai创立之初,摈弃了ROS的快捷路径,而选择重新研发了一整套自动驾驶底层系统架构和操作平台。
到了2015年年底、2016年年初,AlphaGo的诞生使楼天城看到了深度学习的潜能。也是在这个契机之下,他看到了中国赶超美国的可能,即使那时候中国的自动驾驶行业全面落后于美国。
2016年4月,楼天城被吴恩达揽入百度,成为美研无人车开发团队的一员,当时美研是百度自动驾驶的重镇。在百度期间的楼天城,是闪耀的工程师明星——TopCoder中国冠军,编程能力强,代码洁癖、人很聪明这些都是同事对其留下的印象,吴恩达更是盛赞“楼是最顶尖的程序员”。
也正是在百度美研,楼天城遇到了他的“老板”彭军,自动驾驶部门的首席架构师。说起楼天城与彭军的共事,有个故事外人甚少知道。彼时百度为了争取楼天城,给了他诸多自由度,其中包括了自己选择想要一起共事的“老板”。
谈及百度对后来自动驾驶发展的影响,他认为大的IT 公司愿意投入自动驾驶是一件非常好的事情,能从整体上加速自动驾驶的发展和市场接受度,并且百度也建立自有的流程。但是对于创新的项目而言,过多的流程则意味着拖沓以及更为漫长的等待,这也是后来他离开的理由之一。
2016年年末,楼天城和彭军双双从百度离职了,创立了Pony.ai。
新智驾注:Pony.ai的车队
自动驾驶已经走过了“从0到1”
在过去几年的创投热潮当中,自动驾驶是一个无法令人忽视,又尚未看见大规模落地的行业。这中间,很多的疑惑需要解答,很多的模式需要探索。
在过去十年时间,楼天城认为软硬件的共同进步极大地推动了自动驾驶的极速进步。在硬件层面上,以激光雷达为代表的传感器是加速自动驾驶发展的重要因素,到了今天,更加出现了为自动驾驶专门研发的相机;在软件层面上,深度学习的出现更是推动了自动驾驶的急速前进。
也是由于这些软硬件的共同进步使得自动驾驶整个行业走过了从0到1的重要历程,而与此同时,相互伴随的是业界对于自动驾驶的要求越来越高,期待的阈值也越来越高。
他向雷锋网新智驾展现了一条期待阈值不断升高的时间轴:2015年的时候,业界看到一个“自动驾驶”的视频就觉得非常酷炫;到了2016年年底、2017年年初的时候,剪辑过的视频已经不受用了,观众要需要看到更完整的视频,了解整辆车的路测全过程和情况;2017年之后,企业要开始做实地路测,投资人需要坐到车里进行实地的感受,才决定投资与否。
现阶段业界对于自动驾驶落地的愿望越发地迫切,但楼天城认为再沿用过去从0到1的速度衡量下一个“从1-10”的阶段,显然是不合适的。
尽管在外界看来,只要资金充裕的情况下,从0-1和从1-10的差别并不大,但楼天城认为从0到1和从1-10并不是同一个难度系数,从0到1,是证明概念的阶段;从1-10意味着方案的可扩展性和系统稳定性都要提升到10倍以上的层次。“大多数的公司都是倒地于从1-10的阶段。”
具体到自动驾驶的场景,从1辆车到10辆车也意味着系统的稳定性能至少要提高到10倍以上,因为出了事故的代价是一样惨痛的。在量产之前,很重要的一步就是要证明方案的可复制性,因此1-10是极其重要的一步。
楼天城也向雷锋网新智驾表示:Waymo之所以走得如此稳健,和基础框架的扎实不无关系。
有关于场景是否为王的话题, 楼天城认为,严格来说,自动驾驶并没有场景的划分,大家最终都是殊途同归,能够在一个场景里运营得很顺畅的公司,就有将技术迁移到其他场景的能力。 如果一家公司真的能够做到上万辆车并且盈利状态的时候,其实这些场景也就是技术实力的证明。
在技术尚未触达现实之际,关于路线的讨论显得尤为重要。深度学习是当下的技术版图的最优解。
在楼天城看来,“深度学习+规则(rule-based)”是自动驾驶当中比较稳健的做法,他向雷锋网新智驾解释:以黑白灰例,黑白其实一些必须要遵循的规则,而灰色更多的是拥有自由度的空间,具体到驾驶的场景当中,有很多情况是无法依靠规则列举,深度学习最为擅长的就是模仿人的行为。而在自动驾驶当中,这两方面的因素都需要考虑。
辅助驾驶不可能升级成自动驾驶
在自动驾驶尚未成为新出行方式之际,有关于新的未来出行世界的想象有千千万万种。而引起讨论最多的则是以特斯拉为首的渐进派和以Waymo为代表的L4直接落地的方式。李开复更是公开表示:自动驾驶应该一步到位。而业界当中也有人认为以特斯拉为代表的循序渐进的路径才是正确的路线。
楼天城是这样回答这个问题的:L3和L4虽然看似都是自动驾驶的行为,但是双方优化的目标是不一样的。L3优化的只是自动驾驶汽车的准确性,L3很多功能类似于报警——不能够轻易地误报决策,没事就刹一下。但是,L4优化的并不仅仅是准确性,还有召回率(recall rate),L4不能轻易漏掉任何一个物体,因为如果漏掉了会容易产生严重的安全事故。
L3只关注准确性,而L4还要兼顾百分百的召回率,这使得后者在算法上的想法和设计从底层就不一样,选择的软硬件配置也不同。
因此楼天城认为从辅助驾驶发展到L4自动驾驶基本是不现实的,这个进阶之路,就好像从一座山到达另一座山,中间没有一个缆车一样的可以过去。其实很多人也已经尝试走过了,这个缆车至少至今也没有找到。
之所以Pony.ai押注在L4上,也是因为L4是自动驾驶中最大/最有影响力的市场。尽管在L4的全面落地还需要一些年数,局部的落地也需要至少1-2年的时间。楼天城跟雷锋网新智驾说:自动驾驶的扩张不可能像社交网络(如Facebook)的扩张,而是需要真正具体落在每一辆车上。时间不一定是自动驾驶的瓶颈,资本也不是自动驾驶的瓶颈,因为未来能够通过盈利把资本收拢回来。
成本并不是Pony.ai担心的问题,是完全可以通过量产和规模来解决的。自动驾驶行业的分水岭就在于规模数量。组建无人车队真正的难度在于稳定性,因为目前无人车还无法做到标准化生产,需要对每一辆车的软硬件进行调试,保证一致的稳定性,这非常考验无人车公司的技术实力,也是迈向从1到10的关键。未来一年时间,Pony.ai计划将稳定日常运行的车队的规模扩展到100台。
总结
在农历新年开始之际,自动驾驶行业也迎来了几则好消息。
Aurora获得了5.3亿美元的融资、Nuro获得了9.4亿美元融资,图森未来获得了9500万美元的融资。
这些融资事件的发生,足以说明这个赛道有着足够的想象空间,也有足够振奋人心的力量。在未来的长赛道当中,在自动驾驶作为唯一技术决定型的项目当中,Pony.ai 用技术构筑起来的护城河能不能使得使其赢得商业上的优势,期待时间的回答。
。