阿里王刚:末端物流场景下,如何用计算换智能、打造为自动驾驶而生的硬件?
雷锋网按:2020 年 8 月 7 日,全球人工智能和机器人峰会(CCF-GAIR 2020)正式开幕。CCF-GAIR 2020 峰会由中国计算机学会(CCF)主办,香港中文大学(深圳)、雷锋网(公众号:雷锋网)联合承办,鹏城实验室、深圳市人工智能与机器人研究院协办。
作为中国国内最具影响力和前瞻性的前沿科技活动,CCF-GAIR 大会已经度过了四次精彩而又辉煌的历程。CCF-GAIR 2020 延续了过去的强大阵容,提供了 15 个专场(人工智能前沿专场、机器人前沿专场、智能驾驶专场、AIoT 专场、AI 芯片专场、视觉智能·城市物联专场、AI 源创专场、AI+ 艺术专场、企业服务专场、工业互联网专场、AI 金融专场、医疗科技专场、智慧城市专场、联邦学习与大数据隐私专场、前沿语音技术专场)。
在智能驾驶专场,全球MIT TR35获奖者,人工智能顶尖期刊IEEE TPAMI编委,ICCV/CVPR/ECCV领域主席、阿里自动驾驶实验室主任王刚带来了《面向末端物流的无人驾驶技术》的主题演讲。
目前阿里巴巴致力于物流行业的无人驾驶,包括最后3公里的末端物流和城市公开道路的配送。
王刚在会上表示,末端物流场景看似简单,但实际上并不容易。首先相对城市道路,末端道路的非结构化更严重;其次末端物流在产品落地上的成本也要考虑;三是产品的系统应该在全天候、不同条件下都能做到稳定,这些都是挑战。
因此,在算法的智能上,阿里提出了“小前台,大中台”的概念,希望打造一个用计算驱动、数据驱动的赋能组织,让算法减少对人工设计的依赖。
在硬件层面,阿里也在传感器和计算平台上下功夫,打造专门自动驾驶、无人物流设计的硬件。
在系统架构层面,王刚认为自动驾驶系统要具有稳定性,可以利用远程人际共驾等方式来实现安全冗余。
以下是王刚的演讲全文,雷锋网新智驾进行了不改变原意的编辑:
大家好,我是王刚,非常荣幸跟大家分享阿里巴巴在自动驾驶上的思考和实践。阿里的自动驾驶定位和使命,跟其他很多公司不太一样。大家谈论的自动驾驶很多与RoboTaxi、高级辅助驾驶有关,但阿里致力于物流行业的无人驾驶。
用三个短语来概括阿里做自动驾驶的原因:业务有需要、社会有需求、机会有希望。
末端物流和公开道路物流齐头并进
阿里拥有全球最大的物流需求体量和最丰富的场景,从电商菜鸟、同城零售、到本地生活,每天有数亿的快递、外卖、零售单需要被配送到消费者手里。自动驾驶物流并非是要在阿里内部创造新的赛道,相反,它是阿里生态非常自然的延伸,能够跟内部业务形成配合。利用业务作为牵引,场景作为驱动,带动阿里自动驾驶技术的提升。
阿里解决的不只是内部问题,同时解决的也是社会问题。未来人口的老龄化肯定会带来冲击。有一个预测是,未来每天的快递将会达到十亿单的规模,如果不能实现智能化,物流行业将无法承载这样巨大的单量运输。
目前在物流行业,阿里专注于两方面:
首先是末端配送,末端指的是最后3公里,包括园区、社区、校园等场景。同时阿里也关注在城市公开道路的配送,满足物流、同城零售的需求。
目前公开道路上的自动驾驶还处于探索或者研发阶段。我觉得挑战在于,自动驾驶系统不知道自己不知道什么。人工智能是一门实验学科,基于数据驱动,本质上是从范例中学习。但于自动驾驶车辆而言,很多场景是没见过的,系统不知道自己不知道什么。所以公开道路的无人驾驶,需要更多针对公开道路的研发。
末端物流这块也有很大的需求,关键在于成本。如果成本不高,为什么不享受自动化的服务?末端落地上会带来很多便利。跟公开道路不一样的是,末端自动驾驶物流系统只要知道自己知道什么就可以了。因为末端道路的速度、周围参与者的速度都比较慢,遇到不确定的情况,可以用系统化的手段解决。也就是说,并不要求解决所有场景的问题,只需要解决头部比较确定性的问题。
我们可以重新定义自动驾驶,对系统进行正向开发,让每个模块确定自己到底知道什么、了解模块之间的配合。通过思维方式的转变,我认为在未来几年里,低速无人车必然会带来产品化、规模化和落地。
我们的末端运营走得比较前,一年多前就已经在校园、社区、园区三个场景开始真实的物流配送。不只是Demo或者玩具,它每天为数千个消费者带来了便利。“双11”的时候我们的无人车每天可以送3000单。
最初我们认为,比较大、比较重的包裹才有无人配送的需求,但最后发现即便是很小的快递,用户也有让无人车送上门的需求。科技的发展,让我们把更多的时间花在开心的事情上,而不是在烈日之下取快递。
末端自动驾驶物流的技术要求
从技术来看,相对于公开道路,末端物流有很大的便利,但它不是很简单的事情,还是很多约束。
一是智能。虽然相对城市道路,末端物流的道路速度没这么快,但它的非结构化程度更严重,包括路桩、人车混流等。我们将Waymo自动驾驶记录和我们的自动驾驶记录进行了一个调研,在什么情况下无人车需要做横向决策或变动。我们的末端车辆大概比Waymo多20-30倍,假如Waymo一公里做一次,我们的车一公里要做二三十次横向决策。从另一个维度来讲,它是更有挑战的事情,要求我们的无人物流车在复杂环境下能够做到穿梭如飞。
二是成本。公开道路上的测试不考虑成本问题,因为还是科学研究,没面向业务和产品。但末端物流不一样,其产品化的脚步越来越近,我们要切实考虑它能创造多少收益,成本支出限制是什么?成本十几万的一辆车肯定养不活自己。这跟公开道路的无人车是两个不同的课题。
三是稳定。无人车的系统如何做到7*24小时,在不同天气、不同环境下实现稳定可靠的运输?如果无人车成为业务和产品,它必须随时在岗。这个问题的解决不要拘泥于算法的解决,自动驾驶处于一个大的物流系统,很多的单点问题如果从算法来解决,是永远解决不完的。我们要考虑如何用系统的力量、产品的设计,让业务运行起来。
阿里末端物流的实践
所以在系统的设计、链路的打通上,阿里做了非常多的事情。今天我想谈谈在算法上、技术上阿里做了什么事情。
智能化。我们希望这辆车很智能,可以处理不同的情况、不同的场景,可以穿梭如飞。跟其他公司一样的是,我们也做感知、定位、决策、控制,但不太一样的地方在于,我们提出了“小前台,大中台”的想法。
我们认为感知、定位、决策、控制四个模块是人工智能算法模块,本质上需要底层的驱动。很多人都在说人工智能,但我认为应该叫计算智能。人工智能的意思是像人一样智能,但这是不靠谱的。我们想要造一架飞机,不可能像鸟一样做铁翅膀,这不是一个正确的思路。我们更多要用计算机的特点,从数据、计算上找到智能的来源,所以应该叫计算智能。
“小前台,大中台”本质上是希望打造一个计算驱动、数据驱动的赋能组织,让不同算法可以减少对人工设计的依赖。因为人工设计本质上是将自己的知识转化为智能,但人的理解非常肤浅,很难理解图像、激光雷达在高维空间里的表达。过去十几年,机器学习、人工智能的发展本质上遵循一个规律,人的设计是不靠谱的,我们要用计算、自动化方式替代人工设计,从而带来提升。
最初,我们分类器是规则分类。我们发现人工设计的特征很明显,所以用深度学习替代人工设计,变成自动化学习的特征。
第二是传感器、计算平台等硬件。人工智能的发展,是计算代替人工设计的过程。即便到了今天,我们发现感知、定位、决策、控制这些模块里还有大量的人工设计。这些设计不但降低开发效率,需要很多工程师投入,同时严重降低整个模块的质量。我们希望通过计算智能的方式解决。在硬件上,我们做了非常多的事情,以减少硬件成本,同时带来功耗降低。在定位模块、传感器模块,我们根据算法需求往下做得更深。因为现在很多硬件不是为自动驾驶、无人物流车辆设计的,这些设计要么过于冗余,要么达不到需求,我们必须往下做,做得越来越深。
第三是集成系统,系统要保障稳定性。千万不要让所有的问题都交给自动驾驶来解决。我们想做的是面向客户的产品,很多时候可以用系统化的方法。远程人机共驾,就是一个非常好的案例。无人驾驶物流车的好处是低速,可以随时停下,呼叫远程控制中心。未来只要把人工成本降到足够低,可以实现让1个人看100辆车甚至1000辆车。
我们希望建立计算中台,赋能所有的算法,减少人工设计。这跟自主机器学习有点类似,在过去的实践里,大家做的任务比较简单,比如文字识别、图像识别,主要搜索的是感知网络结构、超参数,这是有限制的。但在我们的AutoDrive平台里,我们进行了扩展,可以支持全链路需要,支持感知、规划、定位、控制。
同时为了支持全链路,我们做了非常多工程上的工作,一个典型案例是仿真。比如学习决策规划算法,这不是一个简单的图像识别问题。这条路径开得好不好,能否满足要求?包括评价机制、仿真机制,都是非常难的工作。这方面我们搭建了一个比较完善的平台,支持整个链路的学习。
基于这个平台,我们所有算法工程师都可以把很多需要人工设计的内容交给平台。
在实践落地上,我们也有收获一些成果,比如红绿灯识别。我们在AutoDrive平台上搜索出来的结构不仅效果更好,更重要的是,其计算、结构相对来说简单非常多。
这很容易理解。因为工程师在做网络设计时的首要想法是保障效果,为了效果他会把各种结构累加上去,从而带来效果提升。但里面可能有很多冗余,而工程师不知道。所以人的理解是非常局限的,很难穿透网络结构,直观理解发生了什么事情。而通过数据驱动的方式,可以把系统里面冗余的结构去掉,找到核心的表达。
除了感知外,我们也把平台用在决策规划里。末端场景车辆跟人的交互非常重要,一个决策非常谨慎的车在末端场景里是寸步难行的。如果把它设计得非常简单,可能会出现车辆撞人的情况。那么到底哪种是比较好的状态?靠人的理解是很难做到的,所以通过自动化的方式可以找到比较好的权衡。
此外,在实践上,我们做了一些别的实践,比如车载ISP。目前车载领域满足夜视需求的产品不是非常多。所以我们做了一些简单的实验,让ISP在弱光环境下表现更好。新的ISP相对于业界标准方案,对算法的帮助非常大。
从这一点来看,自动驾驶最后的发展必然是越来越偏向于软硬件一体化。硬件如何为软件服务,软件如何定义硬件,这必须是一起考虑的事情。
此外,我们还做了高精定位低成本方案。如果用大厂的定位方案,一套系统可能要十几万,非常昂贵,这样系统是无法支撑车辆的产品化的。所以我们将定位系统的成本做得非常小,其实际运行也非常稳定。
在Demo展示中,可以看到,两个矿泉水瓶间隔1米,阿里的无人驾驶物流车宽95厘米,即左右两边留下共5厘米的空间。我们的定位方案进行了上百次测试,实现了非常稳定地精确定位。
最后是系统部分。我们的系统有多重安全保证的设计,因为保证安全是无人车运行的基石,是底线。我们的被动安全设计包括远程监控、人机共驾等,这是系统必需的部分。
(雷锋网) 雷锋网 (公众号:雷锋网)
。