百度:今年下半年将推出无人驾驶汽车
杨阳 刘畅
6月4日,在中国云计算大会上,百度高级副总裁、技术战略委员会主席王劲透露,百度在今年下半年即将推出无人驾驶汽车。而这样的无人驾驶汽车,是综合利用百度现有的大数据、地图、人工智能和百度大脑等一系列技术的综合成果。
其实,百度是将与第三方汽车厂商合作制造无人汽车——百度自己不造车,而是去造车的“灵魂系统”。而这个灵魂系统的背后,离不开的是百度地图、大数据以及百度大脑等核心技术。纵观外卖、Uber、无人驾驶汽车等百度正在力砸的垂直领域,无不显现出一个趋势:一场深刻的“变革”正在百度内部悄然发生。
按照王劲透露的逻辑,过去百度一直是连接人和信息,而今天百度正在连接人与服务,把路径变短,把效率变高。该公司想要做的是牵动所有餐饮企业命脉的“订单平台”和租车公司赖以调度的“叫车中心”,而做到这些的关键是技术创新。
一个进入传统行业的路线图正在百度内部各个部门同步实施,而百度进入传统行业的模式非常轻,通过云计算和大数据积累起过去没有的全局化的智能。他们希望用大规模基于数据的“计划经济”去取代无序的、效率低下的“市场经济”。
“聪明的”大数据
或许在中国只有少部分人知道——Coursera网站。这是百度首席科学家吴恩达加盟百度之前在美国曾经做过一个创新,而目前像Coursera这种在教育领域基于学生个人信息八大数据做出的技术探索,仅仅是百度在互联网+的冰山一角。百度在技术方面已经把略带科幻感觉的未来与现实的数据、智能算法相结合了。
在外卖布局方面,百度建了非常大的“骑士团队”,实现了智能派单,智能路径规划:由系统决定骑士的路线和时间,他应该到哪一个餐馆接哪一个单子送到哪里,系统会实时推送给他,并根据大数据测算这家餐馆大概要等多长时间。在出行布局方面,百度投资了U-ber,目前已经获得了市场的很大认可。首先,Uber用的也是系统派单,而不是用一般的司机抢单的模式。派单系统可以根据用户实际情况,给他派最适合的车辆和司机;其次是其智能出价系统。
百度在基础数据上的积累和投入增长迅速。例如此前为了增加百度地图的准确性,百度甚至收购了芬兰的一家技术公司,通过该公司对磁场的判定,能够帮助用户更好地进行定位。
所有的这些投入,在百度内部会被清晰地组合在一起:百度大数据引擎。
三大组件
这个引擎于2014年4月24日百度第四届技术开放日上首次面世,包括开放云、数据工厂、百度大脑三大组件,百度宣布可以将这三大组件在内的核心大数据能力对外开放。
当时李彦宏对台下的嘉宾这样说道:“许多企业拥有海量大数据……不过,它们几乎都没有大数据能力……这时候如果能够应用百度大数据引擎,则可以对海量数据进行可靠低成本的存储,进行智能化的由浅入深的价值挖掘。”
或许当时许多嘉宾并不理解李彦宏话中的商机,但看到无人汽车之后,相信所有人都会明白百度是怎么把大数据变成产品的。
目前,传统企业普遍面临大数据应用困境,数据存储管理和分析挖掘以及智能化能力都存在瓶颈。百度则试图通过“大数据引擎”平台化和接口化的方式,对外开放其大数据存储、分析和智能化处理等核心能力。
特别让李彦宏引以为傲的“百度大脑”,正是采用了计算机加上人工智能,模拟人脑思维的模式,已经拥有200亿个参数,通过模拟人脑的无数神经元的工作原理进行再造:存储及“思考”。
而这必须基于大规模云计算。这就牵扯到了百度在全国先进的云计算基础设施,建成后的百度云计算(阳泉)中心数据存储量超过4000PB,可存储的信息量相当于20多万个中国国家图书馆的藏书总量。
现在,百度牵头发起的全球最大的深度学习开源平台已正式面向公众开放。它相当于世界最大规模的深度神经网络(万亿参数,千亿样本,千亿特征训练)。通过这一开源平台,世界各地的开发者们可以免费获得更优质和更容易使用的分布式机器学习算法源码,从而大幅降低开发和部署分布式机器学习系统及相关应用的门槛。
而百度还拥有更多可以开放的接口,其中语音识别和图像识别就是两个最重要的能力。
三级火箭
作为未来人机交互的重要手段——语音识别技术对人类的影响尤其重要。
百度在国内最先上线了语音识别界领先的基于长短时记忆模型(LSTM)的深度学习技术,使得安静环境下普通话识别的错误率降低了15%,目前的识别率已经从95%提升到96%。
这一成绩超越了谷歌、微软等国际顶尖科技企业。Deep Speech是一款采用深度学习技术的语音识别系统系统,它可以在饭店等嘈杂环境下实现将近81% 的辨识准确率。
在基于大数据的图像识别技术方面,百度的技术更为前沿。吴恩达曾经透露,在人脸识别方面,Google的6000对人脸识别错误百分比为0.37%,百度为0.16%。另一个例子是,百度全景尼泊尔古迹复原行动借助创新的“全景照片游”技术,涵盖大数据分析、三维建模、智能路径规划、图片渲染等多项前沿技术,将网友上传的照片中受损的世界文化遗产以数字化的方式进行复原。
据王劲介绍,互联网+是在传统行业和互联网的结合点做技术、服务和模式的创新,技术是传统行业成功实现互联网+的武器,云计算、大数据与人工智能是互联网技术的三级火箭,也是百度拥有深厚积淀的三个领域。
第一级是云计算。但是现在每一家互联网企业都已经有了自己的云计算产品,百度有百度云,阿里有阿里云,浪潮有浪潮云——在王劲看来,云计算已经不是哪一家企业的独门暗器,企业应该在互联网+的结合点进行服务、模式和技术的创新。
第二级是大数据。云计算时代的竞争已经过去,大数据还有机会。大数据给大家提供了关于人的数据、物的数据、关系的数据,还提供了包括人与人、物与物、人与物的关系。互联网公司用大数据做什么,就能给互联网公司带来什么不同的竞争优势,百度外卖、Uber、在线教育等等案例其实为如何在结合点做突破性创新做了很好的案例。
第三级是人工智能。经过几十年的发展,计算能力和网络传播速率得到了很高的提升,已经能够在云计算和大数据基础上做全局决策的人工智能。
一个最近的例子是,百度发布了融合统计和深度学习方法的在线翻译系统。该系统借助海量计算机模拟的神经元,模仿人脑“理解语言,生成译文”,同时结合百度已有的统计机器翻译技术,在翻译质量上取得了突破性的成果。
在智能交通领域,王劲乐观地预测,未来交通系统将会得到很强的智能化,会由人工智能系统取代今天交通智慧系统,以后车和交通系统的沟通将会无缝,所有车的运行都会由交通系统来控制,不再需要红绿灯面前停下来,而是以非常高的速度交互过去,因为系统非常清楚车所在的位置和速度,能够极大提升整个交通系统的效率。
在王劲看来,未来人们将依托于大数据挖掘与分析数据,让社会资源得到重新合理规划,怎样规划路线最环保,成本最低……而这种基于大数据的平台终将帮助用户摆脱低效无序的生活工作状态,抛弃粗放的“市场经济”,回归智能的“计划经济”。