当人工智能深入百度地图:机器取代人的又一案例
今天,百度对外发布了第二季度财报。财报中提到, 作为百度移动化、服务化的重要产品之一,百度地图在构建服务生态、索引真实世界的进程中正发挥出越来越重要的作用 。 在提升用户出行体验、扩展服务品类的同时,百度地图大力开拓海外版图,目前已登陆亚太、欧洲和南美63个海外国家和地区;并通过与海口、成都等地交通管理部门合作,积极探索政企共建“互联网+智慧交通”新模式。
财报显示,百度地图目前月活跃用户达到 3.43 亿,同比增长 13% 。那么,百度地图持续创新用户服务、布局智慧交通与国际化地图多面并进的背后基石是什么?就在7月28日下午,百度地图首次向媒体开放了其位于广东省顺德市的数据中心。百度地图详细展示了从外业采集到内业数据处理的全过程,完整展示了一个POI点、一条道路呈现在百度地图上的过程;同时,百度地图还首次对外阐述了人工智能、深度学习等技术在地图数据生产领域的应用。
毋庸置疑,百度地图成为人们出行的首选工具主要源于地图基础数据生产力稳步飞跃,而数据生产的核心动能是百度人工智能技术的深度落地。
真实世界数据对地图厂商多多益善
相对于传统采集车而言,百度地图与长安汽车合作的采集车安装了 “GNSS+IMU 、成像系统、 Lidar 点云系统 ” ,率先实现 1 人 “ 驾车 + 采集 ” 模式,可实现全自动采集,大幅节省了外业采集人力。简单地说,采集车是百度地图 “ 数据 ” 的输入,三类系统负责采集不同数据: “GNSS+IMU” 采集定位信息,确保地图的精度,这也是传统地图采集车的重要录入数据;成像系统采集影像,供后期处理使用,这是互联网时代地图采集新增的输入模块; Lidar 点云系统更高级,可采集 4K 地图、高精地图,供半自动驾驶、无人驾驶汽车使用。
除了采集车之外,百度地图采取不同设备采集不同地理场景的数据。汽车不适合进入的小巷、胡同、绿道等场所,可使用电动自动车、步行 + 全景 背包进行采集,以便能够提供步行导航、骑行导航;对于百度地图正在加强的室内全景导航地图,则采取背包单点采集模式。总之,我们看到的全景地图、 4K 地图,均是地图厂商投入大量资源进行采集而获得的,每一个功能背后都是对大量数据的处理。
地图厂商一直对真实世界的数据保持着强烈的饥渴。第一,数据永远不够多,地图厂商希望能够覆盖到人类能到达的一切地方的地理数据;第二,数据永远不够细,地图厂商希望能拿到更精细的道路数据,涵盖更多细节例如转弯信息;第三,数据永远不够全,地图厂商的胃口不只是道路交通数据,还希望能拿到商场、酒店等上层 POI 信息;第四,数据永远不够新,地图厂商希望拿到的数据无限逼近于当前的真实情况,与世界的变化保持同步,例如道路修缮信息、交通拥堵信息等等。更多、更细、更全、更新的空间数据,让地图无限逼近 “ 映射真实世界 ” 的理想。
要做到上述四点的任何一点,都离不开数据采集这一关键环节,地图厂商正在通过定制采集车、研发采集设备等方式来加强数据源采集能力。百度地图通过采集设备还是数据处理技能创新构建了业内领先的数据采集能力,支持全景地图、 4K 地图,还能根据空间情报进行热采集,例如重庆新上了一个复杂的立交桥,百度地图可在一夜之间上线地图导航,再比如最近北京积水之后,百度地图快速上线积水路段提醒,背后都体现了动态数据采集能力。
人工智能成地图数据采集的杀手锏
世界太大了,变化太快了,完全基于人工的地图数据采集和处理,覆盖的地方将十分有限,且很难在时效性上有足够的保障,毕竟人工团作业是需要很长的时间周期的。还有,要获取 “ 更细 ” 的数据,即采集大量细节信息,例如路标、 POI 信息,通过人工更是不可能完成的任务。在覆盖地方更多、时效要求更高、地图精度更高之后,数据采集的工作量将会指数级增长。所以,地图采集想靠堆人来建立数据上的优势,通过壮大外业和内业团队,是不现实的。
百度的解决方案是用人工智能来实现尽可能多的任务。
用机器取代人,正在越来越多行业发生。机器人在富士康流水线上装配,机器人帮助 Amazon 整理仓库和运送快递 …… 这些领域引入机器人之后,效率将会大大提高。
百度地图借助于图像识别、语音识别、大数据处理等人工智能技术,大幅提升地图数据采集和处理的自动化程度。
在外业操作上可通过语音交互等方式,提高采集人员的交互效率,让其可一边开车一边完成各种采集,还有各种自动化系统让外业采集不再那么专业,降低了人力成本;
在内业处理上,即对采集的海量原始数据的处理上,百度地图大幅应用图像识别技术、大数据技术,来识别道路信息和 POI 信息。从通用影像中精准快速的自动识别道路特征、提取轮廓并绘制形状,形成数据补充;可识别道路上新的招牌并转化为 POI 信息;可对道路上过去人眼才能看的图形标牌、地面车标以及文字标牌进行自动化识别;还能对多个数据源的数据进行自动融合;还有基于大数据的情报系统能让采集团队实现 “ 指哪打哪 ” 的定点采集。
通过大数据处理和图像识别等技术,百度地图外采数据有超过 80% 的工作都能实现自动处理,人工处理在百度地图的数据加工中只占不到 20% 的比例,在业内处于领先。
人工智能技术,尤其是大数据处理和图像识别技术,对地图数据采集和处理将带来革命性的改变。大幅提升效率和降低成本,完成依靠人类无法完成的任务,是人工智能的典型要义,百度地图通过人工智能技术来进行数据采集和处理,是机器取代人的又一个生动案例。
百度地图正在从数据驱动到智能驱动
百度在人工智能上大举投入,是最激进的中国巨头。百度成立了深度学习实验室、大数据实验室、人工智能实验室。这三个实验室的技术成果已被大量应用于百度产品中,如移动搜索、百度糯米、输入法、百度翻译等产品。而这三个技术范畴,不论是人工智能还是大数据,又都与百度地图有着密切的结合点,百度地图已开始在数据采集环境大量应用人工智能技术。
众所周知,地图是数据驱动型,真实世界数据对地图厂商多多益善,地图再对这些数据进行高效的处理并转化成对功能或商业价值。这是所有地图厂商不约而同在做的事情。然而,接下来的竞争焦点,就在于谁能更有效率地处理海量地图数据,并从中挖掘出更多的深层价值。挖掘大数据深层价值需要人工智能,高效率处理数据需要人工智能。
百度地图未来很可能会将其正在研发的无人车与地图采集结合起来,实现从单人采集到无人采集 ―― 在自动化技术帮助下,单人采集作业时的重点是驾驶汽车。如果无人车上路,这个人的工作很可能被机器取代。事实上,负责采集数据的街景车与负责运输的无人车外观就很像,它们都有大量基于激光和图像的传感器设备。这些传感器一方面探测道路环境,另一方面收集环境数据,第二点就可为地图所用。基于无人车的高精地图采集,可以在运载人或物时顺便进行,一车二用,大幅降低成本。百度无人车计划在 2018 年商用, 2020 年量产,会不会用在地图数据采集上?
百度地图还拥有 “ 照片游 ” 技术,其背后是三维建模、照片渲染、路径规划等人工智能技术应用。去年百度地图曾利用该技术,基于用户上传的各种照片,来还原尼泊尔加德满都的震前景象。未来,在线旅游与直播、 VR 等技术深度结合之后,百度地图完全有可能帮助用户穿越时间与空间,去到不同地方游玩,或者说,在进行路径规划时更了解目的地真实情况。
百度地图给用户提供的路线导航服务,同样是基于人工智能算法实现的智能规划,能够将公车、地铁、步行等不同交通方案结合起来,并充分考虑地铁班次等信息,背后是人工智能技术的应用,它可以向秘书一样思考用户的出行场景,成为一个真正的 “ 活地图 ” ,给用户更好的出行体验。
最后,人工智能技术还可应用于地图的商业化上。地图拥有海量大数据,这些大数据记录着人类的空间信息,蕴含着巨大的商业价值,例如房地产选点、商家选址、交通规划等等,要用好这些大数据,同样离不开人工智能技术。
提升用户体验、降低数据采集成本,挖掘商业价值,地图与人工智能技术均有大量的结合点。百度公司在人工智能技术上有先发优势,再加上百度地图本身就是大数据型平台,因此与人工智能密切结合就成水到渠成的事情。拥有大数据的平台未来拥抱人工智能技术,不仅成为地图行业的下一幕核心,也是更多行业必然发展趋势。
微博 @ 互联网阿超 微信 罗超 ( luochaotmt )