Pokemon Go 开启“轻AR”时代,未来VR/AR如何演进
一个热潮可以有多火?让平日不关注的人耳闻其名,让公司股价最高期翻一倍?全世界“上瘾”的《 Pokemon Go 》都做到了!这款任天堂携手谷歌通过 AR (增强现实)和 LBS (基于位置服务)所打造的游戏,以一种猝不及防的方式引爆游戏区、科技圈。
《 Pokemon Go 》火了,也带热了 AR 技术。与熟悉的依赖头戴显示设备的 AR 产品不同,《 Pokemon Go 》并没有采用虚拟物体识别等先进 AR 技术,更多借用了 AR 的噱头,即被视为“轻 AR ”应用来与真正 AR 应用区别开来,其他如热门的 AR 早教小熊尼奥也是同类产品。但即使采用的是初级的 AR 技术,《 Pokemon Go 》的空前火爆,也向业界证明了这样的轻 AR 作为未来计算平台杀手级应用所拥有的巨大潜力。
AR 版的“捉妖”记
“ Pikachu ?”随着手机一声提示,通过摄像头,一只宠物小精灵皮卡丘正在当前办公桌上跳动。玩家打开《 Pokemon Go 》游戏和定位功能后,手机会通过摄像头实时拍摄画面,皮卡丘、杰尼龟等小精灵就藏在这些现实环境中,用户只要拿着手机走动便可以抓住这些小精灵。
虚拟世界与现实环境的互动,应用了 AR 技术,正是《 Pokemon Go 》引发科技圈大讨论的最重要原因。不过在业界人士看来,《 Pokemon Go 》所应用的 AR 技术,与凭借“鲸鱼在篮球场上精彩一跃”震惊业界的 Magic Leap 公司的 AR 技术还有一定差距。
( Magic Leap 公司震撼网络的鲸鱼在篮球场腾跃画面)
在 Magic Leap 前核心工程师 、 xPerception 创始人包英泽看来,《 Pokemon Go 》所应用的 AR 技术,主要是通过手机里的陀螺仪,实现虚拟与现实画面的简单叠加。这样的简单叠加,使得皮卡丘可能会出现在水里,或卡在一个实体大衣柜中,用户尝试拿手机接近时却无法捉住。另外,由于《 Pokemon Go 》是基于 GPS 进行定位, GPS 技术本身对运动跟踪并非精准,在小距离范围内会出现误差,也不能进行室内定位。
“尽管《 Pokemon Go 》采用的 AR 技术比较简单,但这也恰恰说明技术本身并不是限制 AR 、 VR 应用发展的必要瓶颈。”他表示。
轻 AR 爆发后的技术发展
《 Pokemon Go 》的 AR 技术并不完美,但现象级效应已彻底向业界证明对技术要求不高的轻 AR 时代已经到来。不仅是 AR , Facebook CEO 扎克伯格判定 VR 技术(虚拟现实)将比 AR 技术更快实现消费化。
实际上在年初高盛发布的《 VR 与 AR :解读下一个通用计算平台》中,明确表示 VR 与 AR 有潜力成为下一个重大通用计算平台,同时指出用户体验、技术局限、内容和应用的开发、价格是制约 VR/AR 普及的障碍。
从技术发展角度看,从现在 VR/AR 较为初级的“轻技术”阶段到后续能广泛普及的成熟阶段,包英泽表示技术未来将从三方面进行演进。
一是交互手段。
真实世界的我们如何与虚拟世界的物体进行交互呢?目前市面上提供的娱乐化产品如 Oculus 、 HTC vive 都需要额外配合游戏手柄来完成,这在包英泽看来并不是最适合未来的交互方式,“未来的交互应该是自然手势交互,例如抓小精灵时不是在屏幕上滑动,而是用自己的手去做‘抓’这个动作就行”,他举例到,目前业界已开始这方面的尝试,技术走在前端的包括 Leap motion 、 xPerception ,便开始通过追踪定位系统来检测人的手部运动和手指运动。
二是适用场景。
对于现阶段的 AR 消费级应用,包括手机端和头戴式设备的 AR 应用,大部分需要 GPS 定位从而只能在户外使用。对于在室内的使用,则需要标记物,使得其应用基本局限在 2m×2m 的范围,如欧洲的 Wikitude 、高通的 Vufovia 等产品。同时基于手机上的 AR 应用功耗也是个大问题,常常画面卡顿、手机电池使用时间缩短近 2/3 。
在 VR 侧,问题同样突出。目前业界主流头戴式 VR 设备如 Oculus 、 HTC vive ,为增强临场感,通过外置红外激光这样“由外而内( outside-in tracking )”的追踪方式,来确保用户真实世界中的行为与虚拟世界的行为一致。而这样的“由外而内”的方式也意味着用户需要自己组建硬件、调整配置,其适用范围也就只有 3m × 3m 。不过现在 Google Tango 正采用最新的“由内而外( inside-out tracking )”方式,即直接通过用户头戴式设备来进行对现实的观测与追踪,而免去对外部设备依赖,以实现更广范围的互动。
三是使用安全性 。
现在无论是 VR 还是 AR 技术,都缺乏避障功能,这使用户面临着人身安全性威胁。当用户的双眼沉浸在虚拟世界中,而现有产品又缺乏物体、环境识别功能时,家里家具的变化、突然出现的宠物都可能引发一场猛烈的撞击,暗含巨大的安全隐患。
其实《 Pokemon Go 》游戏频繁出现的事故也在一定程度上展现了安全隐患苗头:前不久美国圣迭戈恩西尼塔斯两名男子为玩游戏,从海岸悬崖跌落受伤。
计算机视觉:给“黑科技”加上眼睛
未来,无论是上述中 Leap motion 对自然手势交互的研究、 Google Tango “由内而外”技术对场景的开拓,还是避障功能的增加,“其实主要是解决计算机视觉技术中的物体姿态识别、视角跟踪、场景重建三个功能。”包英泽解释到,计算机视觉技术之于机器,就如同眼睛之于人,是感知、理解世界的最重要“器官”,所以计算机视觉的发展对于 VR 、 AR 的意义便不言而喻。
姿态识别、视角跟踪、场景重建,是计算机视觉着重解决的关键问题,涉及处理器、传感器、算法实现等技术环节,包英泽表示其中目前业界热门研究、关注的是融合了动作传感器的 SLAM (即时定位与地图构建)算法。
现在 SLAM 使用的传感器主要有两类,单目摄像头和双面双目摄像头。包英泽表示,单目摄像头体积小,但由于不能获得“视差”,不能准确获得物体的三维信息,所以在姿态识别功能上准确率较差,同时当物体运动缓慢时,难以进行位置追踪。而双目摄像头虽然相比较体积更大,则因为可以获取“视差”,同时有信息的冗余能较低算法的误差,“所以未来多目摄像头将成为主流的产品”。被业界视为目前体验最好的 AR 设备 Hololens ,便采用了多目摄像头。
SLAM 算法实现是业界最前沿的技术走向,但不得不说也是一个亟待突破的技术症结所在。从 2008 年的 PTAM ,到现在的 orb slam 开源软件包,尽管 SLAM 算法已有多年发展,但基于开源的算法实现效果在精度、鲁棒性方面都表现较差。“现在开源的位置追踪,与实际人的真实运动轨迹相比误差太大,一不小心监测的运动轨迹就会出现严重的漂移,甚至错误的引导人撞到墙上。”他表示,精确的轨迹跟踪,特别是将传感器和 SLAM 算法融合的实现,全世界能做到的技术团队屈指可数, Google Tango 、 Hololens 、 xPerception 算其中极少数。
未来三年,下一代独角兽从这里诞生
世界在不停改变,十年前人们上网最主要内容是阅读文字,而未来三年人们将迎来虚拟与现实的互动,计算机视觉势必成为下一个新的技术高地。
“我们知道计算机视觉往往需要非常复杂的算法去解决,而应用往往都是移动化的,例如基于手机的应用。在移动化的设备里面,要以低能耗的方式进行复杂的算法,芯片一定是必经之路。”包英泽表示,现在行业里面有大量团队在进行算法的研发,一些走的比较快的同行已经开始将成熟的算法芯片化了。
同时,目前除了 Google 、英特尔、微软等巨头在马不停蹄进行技术研究、应用,包英泽预测这个领域一定为诞生更多的专业化团队,去提升计算机视觉系统在不同平台、不同使用环境下的表现与性能,解决重大安全问题与应用,“与这对应的技术有数百亿的市场,计算机视觉领域将诞生出很多上市企业”。
该说法也得到了不少硅谷风投从业者认可。在硅谷,围绕图像识别、计算机视觉、深度学习等关键技术的投资热度在明显增强,并将长期进行持续且深入的投入。
基于高盛的标准预期,到 2025 年, VR/AR 市场规模将达到 800 亿美元。 AR/VR 作为下一个重大通用计算平台将创造一个崭新的世界,而计算机视觉技术无疑将加速这场革命。