#首发# 无人驾驶安全问题难突破?Momenta将成为破局者
▲ Momenta公司创始人曹旭东
“我相信未来世界的生产力和自由,将来自大数据和智能。而深度学习的无人驾驶技术本身是一个较为年轻的领域,更新换代的速度非常快,对自己技术的实践应用是一个机会,这也是我选择无人驾驶方向的原因,”Momenta创始人曹旭东说道。
Momenta是一家刚成立不久的专注做无人车大脑的公司, 核心技术 是基于深度学习的环境感知,高精地图,驾驶决策算法。产品包括不同级别的自动驾驶方案,以及衍生出的大数据服务。
放弃学业、放弃高薪,一心只为AI
Momenta公司的CEO曹旭东2008年毕业于清华大学,本科专业是工程力学,但对统计学有着浓厚的兴趣。本科毕业后,他顺利成为清华大学的直博生。在博一期间,他对人工智能尤为感兴趣,“当时我一心扎入人工智能计算机相关的课程,哪怕自己上课、看书、查文献都乐在其中,”曹旭东回忆说。对于AI,曹旭东可以用痴迷来形容,博一过后为AI出国深造申请了退学,即使在导师三次挽留的情况下也没能改变他的主意。
离开清华后,曹旭东来到 微软亚洲研究院 ,因微软的技术和学术氛围留在了这里,如愿做了AI相关的研究,他所研发的 视觉识别技术 被用在了 Xbox , Bing , How-old 等知名产品。
2014年底,深度学习还似炼丹术,其中的原理无法讲清楚,而在理论研究上,曹旭东已经有了自己的一套研究方法并发表了很多学术文章,但终不能令他满意,他认为理论需要解决实际问题 。
所以,为让自己的研究成果能在实践中得到验证,曹旭东曾参加了National Data Science Bowl比赛,与1000多支来自世界各地团队的选手角逐,并拿到全球第二的好成绩。
2015年,曹旭东将创业目标锁定在了 无人驾驶领域 ,之后基于对“个人和环境的交互能激发智能”的执着追求,曹旭东开始了无人驾驶的技术路径和商业路径的探索,并创办Momenta,专注做 无人车的大脑 。
如何解决无人驾驶最重要的安全问题?
据统计,从全球人类司机在一亿公里发生致命事故一至三起,而无人驾驶需要做到更安全,安全意味着低事故率。一个系统要做到低事故率,通常要做到: 一是发现问题,二是解决问题。
而解决这些问题则需要无人车进行大规模数据收集和测试, 一方面需要海量的测试车辆,另一方面是高昂的单车成本 。
Momenta的做法 是用无人驾驶模拟、众包数据收集和测试两种互补的解决方案降低无人驾驶的低事故率。
具体来讲,无人驾驶模拟可以通过算法生成感知和决策数据,减少数据收集和测试车辆数量,降低研发成本。
但曹旭东坦言,无人驾驶模拟也存在不足。
第一,模拟生成的感知数据和真实的数据存在差异,实际中,还是以真实数据为主,生成数据为辅。
第二,模拟的规则是人制定的。很多失败的场景恰恰是人思考的盲点,单纯通过模拟并不能发现。
另外,曹旭东告诉创业邦(微信搜索关注:ichuangyebang),“虽然模拟可以降低数据收集和测试车辆的数量,但是我们仍然需要收集真实数据,用大量的车做真实测试。”
而在单车成本方面,其主要由三部分构成: 设备成本 , 造车成本 , 运营成本 。后两者已经优化了上百年,很难降低。设备成本方面,Momenta发挥算法优势,通过多摄像头等廉价设备实现无人驾驶。
“摄像头是所有感知设备中信息量最大的,需要人脑水平的强人工智能,才能从间接视频数据中提取出无人驾驶所需要的直接数据,”曹旭东称。
降低造车成本和运营成本目前最好的办法是通过众包模式让其他人承担这部分成本,这种模式其实代表性的公司已经有 特斯拉 这些大佬在尝试,但遗憾的是他们需要造车、读取和控制车辆行为,这需要很大的时间成本,显著慢于算法的研究节奏。
“我们的想法 是直接利用已有的运营车辆,避开造车、改车、控制车等过程,通过众包,就可以获得海量环境和行为数据,并构建高精度地图,再通过数据驱动的方式学习无人驾驶决策,”曹旭东这样告诉创业邦(微信搜索关注:ichuangyebang)。
高精度地图方面,Momenta通过多张图像存在的视差,利用点的对应关系,将图像中的2D点恢复到真实世界中的3D点。从基本原理出发,建立高精地图,Momenta用不一样的方式尝试解决三个难题。
✦图像部分:检测识别语义点。
不同于传统的SLAM或者SFM算法所用的SIFT、ORB等人工设计的特征点,Momenta的方法是定义道路标线、标牌等地标上的点作为语义点,通过深度学习和数据驱动的监督训练得到模型,可以准确检测和识别语义点,解决检测不到、匹配错误的问题。
✦几何部分:通过众包间接实现海量摄像头测量效果。
不同车辆,不同时间,经过同一地标,即使光照视角不同,通过语义点模型把所有车辆拍摄到的同一语义点关联起来,这相当于间接实现了多摄像头测量的效果。
众所周知,视觉测量中,摄像头越多、视差覆盖越全,测量精度就越高。Momenta的 实验验证 ,随着众包车次的增加,真实3D点位置估计的准确性有量级上的提升。
✦GPS部分:给每个语义点精确的GPS坐标。
Momenta的考量是:
(1)让高精地图通用。GPS坐标是地图的通用语言,给每个语义点赋予GPS坐标,便于他人使用。
(2)消除累积误差。单纯使用几何方法构建局部地图,会有累积误差,结合GPS,可以解决这个问题。
(3)消除局部地图歧义性。当局部地图有重合或者语义点缺失的时候,确定局部地图坐标系很麻烦,但全局GPS坐标系没有这个问题。
任重而道远
无人驾驶技术是一个非常庞大的知识体系,定位、感知、决策、控制是其亟待解决的四大问题,在这四个方向上都有很多子问题。对于初期的Momenta而言,团队来源于清华大学、麻省理工学院、微软亚洲研究院等,有深厚的技术积累和很强的技术原创力,这将是其布局驾驶的技术和团队优势。
但创业邦(微信搜索关注:ichuangyebang)认为,目前Momenta如何紧跟时代潮流,尽快将不同级别的无人驾驶技术落地,以及对行业大数据的快速积累将是当务之急。而在瞬息万变的AI领域,面对竞争对手和行业巨头们,Momenta接下来的路任重而道远。
目前,刚成立不久的Momenta获得A轮500万美元投资,本轮由 蓝湖资本 领投, 创新工场 和 真格基金 跟投。
团队成员:
▲Momenta团队成员
曹旭东,Momenta公司CEO,毕业于清华大学。创立Momenta之前,先后任职于微软亚洲研究院和商汤科技,有近百人研发 团队管理 经验以及丰富的产品落地经验。研发技术用于Xbox,Bing,How-old等知名产品。对无人驾驶环境感知,高精地图,驾驶决策有深入研究。
任少卿,Momenta公司研发总监,毕业于中国科技大学与微软亚洲研究院联合培养博士班,提出适用于物体检测的高效框架Faster RCNN和图像识别算法ResNet,后者相关论文于2016年获得计算机视觉领域顶级会议CVPR 的Best Paper Award。这两项成果帮助微软在2015 ImageNet, 2015 MS COCO Challenge等比赛中获得 多项冠军 ,比赛的参与者包括来自 Google Brain , Facebook AI Research 等著名AI实验室的若干队伍。