实现VR的殿堂级定位技术,HTC和OptiTrack都是如何做到的?
按:本文作者系VR行业从业者。
VR
虚拟现实
作为近未来最炙手可热的显示技术被科技界追捧,今年更是有一大批良莠不齐的VR设备以迅雷不及掩耳之势被推送到我们面前,要经受住市场的考验就必须有超强的技术作为保障,定位技术无疑成为关键的一环。HTC和OptiTrack无疑是VR行业的佼佼者。
简单来说,VR室内定位技术可以使得用户可以在佩戴VR头盔时,除了在沉浸式的世界里原地旋转、还能利用算法和传感器感知到用户的移动,从而确定用户在空间里的相对位置。一款具有空间定位的VR设备不仅能更好地提供沉浸感,其产生的眩晕感也会大幅降低,用户因为位移造成的画面不同步感完全消失,虚拟世界可以与你的身体保持一致的移动性。
目前流行的定位技术有低功耗蓝牙定位、WiFi定位、超声波定位、红外定位、激光定位等,HTC vive的Lighthouse室内定位技术属于激光定位技术,OptiTrack全身动作捕捉系统采用的定位技术则是被动式红外光学定位技术。接下来我就给大家解析一下这两种技术,并做一个深入的对比。
| OptiTrack的被动式红外光学定位技术如何实现?
从理论上说,对于三维空间中的一个点,只要这个点能同时为两部摄像机所见,则根据同一时刻两部摄像机所拍摄的图像和对应参数,可以确定这一时刻该点在三维空间里的位置信息,如下图:
被动式红外光学定位方案的基本原理简单的说就是如此,它利用多个红外发射摄像头、对室内定位空间进行覆盖,在被追踪物体上放置红外反光点,通过捕捉这些反光点反射回摄像机的图像,确定其在空间中的位置信息。
具体实现方案如下:
被定位物体上布满标记点,利用红外发光装置发射出红外光线照射在标记点上,该种标记点表面为反光材料,增强其对照明近红外光的反射能力,从而达到图像中标记球与周围环境明显区分的目的。
近红外摄像机捕捉到目标物上标记点所反射的红外光后,将多台摄像机从不同角度采集到的图像传输到计算机中,再通过视觉算法过滤掉无用的信息,从而获得标记点的位置。该定位法需要多个 CCD 对目标进行跟踪定位,需要至少两幅以上的具有相同标记点的图像进行亚像素提取、匹配操作计算出目标物的空间位置。
OptiTrack的做法是在摄像头周围放置红外发光阵列,在目标物上固定高反射红外光的标志点小球,我们从下图可以看出,应用于动作捕捉系统时,目标物上布满了标志点小球。这样,加装红外光滤波片的摄像机即可以很好的捕获空间中发射红外光的标志点,而将可见光部分的背景滤掉,提高了传感器获得图像的信噪比,增加了系统的鲁棒性。
OptiTrack定位方案适用于游戏与动画制作,运动跟踪,力学分析,以及投影映射等多种应用方向,在VR行业有着非常大的影响力。目前,国内的诺亦腾采用的定位方案即是OptiTrack的被动红外光学定位。
-
被动式红外光学定位技术有哪些优劣势?
被动式红外光学定位系统定位精度较高。其所用的摄像机具备很高的拍摄速率,并且通常是采用全局快门方案,所有像元同时曝光以确保图像不会有运动模糊的现象,并且由于该类系统总是能够得到标记点在当前空间的绝对位置坐标,不存在累积误差。此外,被动式红外光学定位系统可以实现同时定位多个目标物。
但是被动式红外光学定位系统存在着遮挡、造价昂贵、目标数目不可过多几个缺点。
视线遮挡(Loss of Sight)一直是光学定位系统最常见的工作失效原因之一,被动式红外光学定位系统也存在这样的问题。近红外光学定位系统中,当红外光线被用户或物体遮挡时,空间点三维重构由于缺少必要的二维图像中的特征点间对应信息,容易导致定位跟踪失败。遮挡问题可以通过多视角光学系统来减轻,但这又造成了该系统又一大缺陷——价格过于昂贵。
所谓多视角光学系统即在系统中使用多个摄像头,如下图:
被动式红外光学定位系统对摄像头要求非常高,造价也就非常昂贵,几万甚至上十万。 而要采用多视角光学系统就需要很多这样的摄像头,直接导致整个定位系统的成本翻几倍,高得让人咋舌。所以该类系统的应用场景主要还是在财大气粗的影视制作、动画录制等商用方向,而对于其它行业和家庭娱乐领域就显得遥不可及。
此外,被动式红外光学系统虽然可以实现多个目标的同时定位,但是目标数目不可过多。
一方面,因为该类系统本身无法识别标记点所属的定位目标,所以如果有多个目标的情况下,其必须通过处理所有标记点图像,通过估算来判断标记点所属的定位目标,并实现目标的空间定位。 这样的话,如果定位目标非常多,就会造成系统负荷过重,因而导致定位卡顿和延迟等现象。
另一方面,如果想要定位的同时跟踪目标的姿态,就必须保证目标物体有足够多的标记点,而标记点过多会导致遮挡和负荷过大的问题。因此,该类系统所能定位和动捕的目标数目不可过多,少数几个可以实现。
因此,要想将被动式红外光学定位系统应用在VR行业,并广泛推广到我们的日常生活中,就必须要解决遮挡、成本过高、目标数目不可过多的问题。
以上我介绍的是OptiTrack的被动光学定位技术,而OptiTrack还有其主动光学定位技术,该技术采用其独特的照明专利技术,利用LED阵列加快放电速度,满足捕捉超快运动时的照明需求,配合主动发光的850nm红外LED标记点,不仅可以实现室内光线环境复杂的情况下排除其他光线干扰的定位,也可以实现户外定位。
接下来,我们再来看一看HTC Lighthouse室内定位技术的实现原理。
| HTC的Lighthouse室内定位技术如何实现?
曾有体验者这样形容自己的体验过程:
“我手上拿着两把枪,对着前面的丧尸射击,手已经紧张到颤抖,前面的丧尸越逼越近,恐惧感越来越强烈,转身突然发现一个丧尸扑在我面前,瞬间被吓了一跳,毫不自觉的往后躲,明显感觉到心跳加快,还差点尖叫了出来,真的像去了另一世界一样……”
可见HTC Vive产品具有非常好的沉浸感,这里面就有室内定位技术Lighthouse的功劳。
HTC的Lighthouse室内定位技术属于激光扫描定位技术,通过墙上的两颗激光传感器识别佩戴者佩戴的机身上的位置追踪传感器,从而获得位置和方向信息。
具体来说,Lighthouse室内定位技术不需要借助摄像头,而是靠激光和光敏传感器来确定运动物体的位置。
两个激光发射器会被安置在对角,形成一个15×15英尺的长方形区域,这个区域可以根据实际空间大小进行调整。激光束由发射器里面的两排固定LED灯发出,每秒6次。每个激光发射器内设计有两个扫描模块,分别在水平和垂直方向轮流对定位空间发射横竖激光扫描15×15英尺的定位空间。
HTC Vive头盔和手柄上有超过70个光敏传感器。激光扫过的同时,头盔开始计数,传感器接收到激光后,利用传感器位置和接收激光时间的关系,计算相对于激光发射器的准确位置。同一时间内激光束击中的光敏传感器足够多,就能形成一个3D的模型。不仅能探测出头盔的位置,还可以捕捉到头盔的方向。定位流程可以由下图展示:
激光定位技术有哪些优势?
-
成本低。
相对昂贵的红外动作捕捉摄像机,利用激光光塔进行动作捕捉的成本就相对低廉很多了。去除其他成本,定位系统的价钱大概在400美元左右。众所周知,设备昂贵一直是阻碍VR设备走入我们的日常生活的重要因素,毕竟愿意为VR花上千甚至几千美元的普通消费者还不够多。而激光定位技术在很大程度上解决了VR设备成本过高的问题,从而为VR设备从影视、医学这样的领域扩展到我们的日常生活中铺了路。
-
定位精度高。
在VR领域,超高的定位精度意味着卓越的沉浸感。激光定位方案的精度可以达到mm级别,也就成就了HTC我们体验到的震撼效果。
-
多目标定位。
激光定位技术可以实现无限多目标的空间定位。因为,激光定位技术可以采用分布式处理方式,即每个定位目标各自携带自己的处理单元,而处理单元也可直接识别自己的定位节点数据,自行计算,实现每个定位目标独立定位。即使增加再多的定位目标,也不会造成系统负荷过重。这一点使得激光定位技术非常适合应用到VR行业,实现无限多目标共用同一虚拟现实体验系统。
-
此外,激光定位技术几乎没有延迟,不怕遮挡,即使手柄放在后背或者胯下也依然能捕捉到。
激光定位技术在避免了基于图像处理技术的复杂度高、设备成本高、运算速度慢、较易受自然光影响等劣势的同时,实现高精度、高反应速度的室内定位。目前,使用激光定位技术的还有G-Wearables 自主研制的StepVR产品。
激光定位技术的劣势
激光定位技术也存在劣势,首先是系统稳定性、耐用性问题。激光定位技术需要使用激光定位光塔,光塔激光是由电机带动扫描定位空间,而电机属于机械控制,机械控制本身即存在稳定性和耐用性不够好的问题。
激光定位技术应用于VR行业还有一个最大的拦路虎——大范围的应用。
由于激光的扫射面积有限,因此,定位空间受到激光射程的限制,一般在5*5*2m范围左右。这就使得激光定位技术做大范围的应用难度非常高,使用受限。
为了解决这一问题就必须采取扩展方案,即将多个这样的5*5*2m连接在一起形成一个大范围的定位应用,可是这又涉及到扫射激光的区分以及相互干扰问题。 为了实现定位,接收端就必须可以区分不同来源的激光,而且由于光塔过多会产生相互干扰,因此 不可随意增加定位光塔的数量来扩展定位空间 。
目前市面上对该问题还没有好的解决方案,国承万通的StepVR产品在产品发布会上宣布其对激光定位技术做了诸多改进,其中就包括可无限扩展,但该产品尚未面市,可以期待一下。
最后,读者可以通过下表来对比查看两种定位技术的优劣势。