灵动科技齐欧:以AI为脑,让机器人可以用眼睛“看”世界
Yann LeCun体验OVIS行李箱
在2019年4月的爱迪生奖现场,被誉为“卷积网络之父”Yann LeCun被现场一个小小的旅行箱所吸引,玩的不亦乐乎。
并且LeCun居然给出了“目前在美国,神经网络还主要应用在互联网领域,但你们却已经将神经网络应用在硬件产品上。”的肯定。
这个小小的旅行箱就是灵动科技所研发的OVIS行李箱,它与正常旅行箱最大的不同就是其被赋予了视觉AI技术,成为全球首款智能侧跟登机箱。
其实在OVIS行李箱的背后,灵动科技在计算机视觉的自主机器人技术领域下了非常大的功夫。相比于市面上通过物理定位等外部辅助运作的AI机器人产品,通过计算机视觉的方法让人工智能深度学习可以更加贴近人类的行动方式。
同时,不止局限于产品本身,打造视觉自主机器人的开发平台才是它的“王牌”。这套开发平台既可以为内部的产品,同时未来还能为整个行业赋能。
灵动科技创始人齐欧先生
前不久,钛媒体就与灵动科技创始人齐欧先生做了一次沟通。对于这家仅成立了3年的初创公司,它到底蕴含了怎样的“魔力”,又会为人工智能的未来发展带来哪些变革呢?我们一起来看看吧。
OVIS行李箱:灵感来自星球大战中的R2-D2机器人
喜欢星球大战的朋友们一定会记得R2-D2这个机器人吧?R2-D2可以说是星战的头号机器人,它是一个典型的机智、勇敢、而又鲁莽的宇航技工机器人,憨态可掬,每次都陪伴在主角左右,0.96米的身高,却塞满了装有各种工具的附加臂,这使他成为了一个了不起的太空船技工和电脑接口专家。
OVIS行李箱最初的设计初衷就是希望一个机器人能够真的出现在我们身边,完成他对我们的一些服务和帮助和乐趣。所以这个希望就以行李箱形式出现了,这会是大家第一个个人机器人。
它属于你个人,就像80年代有台个人电脑一样,然后我们希望这个机器人它能够做到认识主人,他能够跟随主人做移动和搬运,它能够本身带拍照的功能,然后帮助主人携带物品,它也可以给你身边不可或缺的手机做充电,然后成为生活中的小帮手。
全球首款智能侧跟登机箱OVIS
据齐欧表示,OVIS行李箱只是第一代产品,随着技术的不断的前进和一些边缘计算的芯片的不断的出现,我们在第二第三代产品希望能做到路径的引导。
未来的智能旅行箱预期能力是你给他看登机牌,然后他会带你去登机口,从跟随到它能够引导。别看OVIS行李箱的功能看似简单,但其背后却蕴藏了很多关于人工智能、机器视觉以及深度学习的技术。
首先,OVIS行李箱用了五颗摄像头,其中有四颗是360度环绕视觉。然后为了使四颗摄像头可以同时捕捉环境,是每秒120帧的速度,每1/30秒四个摄像头的数据能拼到一起。
这是什么概念呢?就是我们今天所谓自动驾驶这种外来的雷达,差不多是每秒10帧,它通常是64线的信息,而这四个环视摄像头本身是超过500线的信息。
所以OVIS行李箱基本上做到了一个比Velodyne激光雷达还要再快三倍的这种帧数,然后比它要更全面的信息,并且是在有限算力下,实现每分钟有30G的这种大高通量的信息给到AI算力平台。
第二方面,不光是有图像信息,基于深度学习的计算机视觉还能检测到附近有几个人,然后找到主人,并做识别跟踪,和出框后回来的主人再识别。这些是今天的计算机视觉的核心大厂在做的技术。
此外,行李箱还要知道哪里可以走,哪里不可以走,这叫可行使区域的分割,这部分是自动驾驶的技术。
第三方面,OVIS行李箱的底盘和车底盘相比,车是一个经过几十年迭代的完美的底盘,而行李箱的底盘是一个相对成本有限,灵活度有限的底盘。
所以除了依赖底盘自身的轮子反馈,然后还要加VSLAM视觉的反馈,通过视觉能够知道空间、位置、和自己的相对移动距离。
第四方面,侧面跟随的算法的革新。经过灵动科技的研究发现是很难穷尽整个环境的一些复杂度的,所以OVIS行李箱使用了强化学习技术,做路径的优化。通过训练和仿真的方法,将40万组数据做baseline, 然后再做不断的迭代。
所以OVIS行李箱是一款行李箱形态的视觉自主机器,通过这个产品,打通了整个技术链条和供应链链条,形成了一个视觉自主机器人的开发平台。
这个平台包括硬件和软件两部分。我们具体来看,我们刚才其实看到计算机视觉,手眼协同的机械臂,轮子和眼睛协同的移动能力,加上多车的协同调度算法(云端大脑)。
B端物流机器人:视觉自主机器人开发平台的行业泛化应用之一
灵动科技物流仓储机器人
其实,智能侧跟登机箱只是一个实例,灵动科技在产品端已经在行业领域进行了更多的思考与赋能。既有大量的体力工作,并且又是重复的,可有机会被机器所去协同。在这个层面来看,灵动科技现在选择的是在制造、运输和农业这三个行业。
当前,很多物流搬运机器人是基于固定路线,沿着铺设好的磁条或者二维码走,但无法避障;也有一些通过激光雷达进行定位和避障,但多线激光雷达成本过高,单线激光雷达无法适应复杂的仓储环境。
灵动科技的仓储机器人使用了视觉定位导航(VSLAM)与环境理解(CV)技术,以摄像头为主要传感器,可以完成三维空间的定位与环境理解,这也使得仓储机器人硬件成本只有千元。
期望中的场景应该是:仓储场景不变,然后机器有视觉,可以用机械臂来做卸货。叉车有视觉和移动能力,可以做平面的搬运,然后机械臂加可用的底盘可以做拣货,然后可以做相关的一些自动打包,然后最终再装箱上货。
工业化的场景和机器人
6%的GDP其实有几百万人在做重复性的搬箱子、推小车的工作,如何来使他更多地减少人的这些重复性的枯燥工作,有不同的路径。
目前人工智能分为两派,一派是说我们花很多钱重新去把你的场景都推导出来,我们叫自动化派,基本上是用20年前的技术。
但是最新的场景,视觉机器人其实就像我们叫自主移动,或者更偏叫AI机器人,他们希望假设是对场景不做变化,而是使机器有视觉感知移动的能力,它来帮助人们做事。
应用场景值得深挖:用机器人在可预测体力劳动上辅助人类
今天在场景具体应用来看,每单拣选成本可以有35%的综合程度上的下降,也是对行业最大的一个帮助和贡献。在灵动科技的眼里,物流行业是很大市场的,15%的GDP这15里头是6+9,6%在仓储,9%在运输上面。
智能机器人能做的事情,就是在对可预测体力劳动上,用机器人来辅助人类工作。这个行业上来看,其实我们有若干个行业可以探索的机会,像酒店餐饮、制造、运输、农业、零售、矿业。
其实制造业和运输业,工人都是用这种机器车和轮性机器人来去解决。我们刚才看到割草机其实它是农业的一个行情的具体实现。
因为我们知道物流占中国15%的GDP,而它也是一个急需有机器来帮助来做的行业,来满足诸如每年“双11”大量订单增长。所以,我们刚才看到目前有四款工业化的场景和机器人。(本文首发钛媒体,作者/Kiwi)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App