智能手机 3D 视觉之战:苹果不再一枝独秀,Android 全面崛起
随着华为 P30 系列的发布,智能手机在拍照方面的极限得到了进一步的突破;尤其是华为 P30 Pro 手机,在高达 112 的 DXO 评分下,也让人们见识到了后置四摄(4000 万像素广角镜头 + 1600 万像素超广角镜头 + 800 万像素远摄镜头 + ToF 深度感应摄像头)的威力;当然,这其中,ToF 深感感应摄像头给华为 P30 Pro 带来的,不仅是拍照方面的提升。
实际上,ToF 技术的加持,成为华为 P30 Pro 的一个新亮点,也将整个智能手机行业对 3D 视觉技术的应用推向一个新的高潮。而在外界的传闻中,苹果也正在现有前置 3D 摄像头的基础上,积极布局后置的 ToF 技术,让人对 3D 视觉在智能手机上的未来有了更大的憧憬。
从结构光到 ToF,3D 视觉如何走向智能手机?
目前 3D 视觉技术有 3 种主流方案,分别是结构光方案、ToF 方案以及双目立体成像方案;其中,结构光和 ToF 受到智能手机行业的广泛关注。结构光和 ToF 的工作原理分别是:
-
结构光技术:通过近红外激光器,将具有一定结构特征的光线投射到被拍摄物体上,再由专门的红外摄像头进行采集。这种具备一定结构的光线,会因被摄物体的不同深度区域,而采集不同的图像相位信息,然后通过运算单元将这种结构的变化换算成深度信息,以此来获得三维结构。
-
TOF 是飞行时间(Time of Flight)技术的缩写,其原理是:传感器发出经调制的脉冲红外光,遇物体后反射,传感器通过计算光线发射和反射时间差或相位差,来换算被拍摄景物的距离,以产生深度信息,此外再结合传统的相机拍摄,就能将物体的三维轮廓以不同颜色代表不同距离的地形图方式呈现出来。
奥比中光手机事业部总经理胡科峰告诉雷锋网,在上述两种方案中,当前结构光的技术已经相当成熟,在技术、生产等方面都是如此,甚至业界已经开发出多种高低中配、适合于各种档位手机需求的方案——仅供成熟度来讲,实际上,并不亚于当前的大面积光学指纹。他认为,
相对于结构光而言,ToF 方案在智能手机上的实现还有不少难题要解决:
-
ToF 方案的分辨率不如结构光高,而且自身功耗相对比较大;
-
在扫描应用中,当前的 TOF 方案实际上在不同的颜色、纹理和材质方面会一些影响,这是由它的原理所决定的,结构光在这个上面会好一点。如果以两种方案同时来扫描熊猫,结构光方案受颜色的影响小,所以出来效果会更加逼真;而在 ToF 方案下,有可能出现这种情况:白色部分出来是 OK 的,但黑色部分有可能会受到一些影响。
-
当前的 TOF 方案面临一个问题:在远距的时候,它的深度完整性经常是不如结构光方案的,这一点奥比中光已经有一些对比测试可以表明。在体感游戏中,体感的原理是在于提取相关的骨骼点作为特征点;如果深度完整性好的话,这些特征点都不会消失。
ToF 原理
然而,胡科峰表示,适用于智能手机的 3D 方案有一些重要要求——小型化、低功耗、易量产。从这些要求来看,TOF 和结构光方案是各有优缺点;如果以提高功耗为代价,或者采取放大体积为代价,很多问题是可以被解决。但是,放在智能手机上,就需要平衡各个方面,做到机器小,功耗也低,量产又非常容易。综合几点的话,相对来讲就是两种技术都有一些还要克服的难关。
不过,胡科峰告诉雷锋网 (公众号:雷锋网) :
相对来讲远距而言,结构光的相对精度是会差一点的。基本上ToF 的精度曲线是非常的平缓。结构光的精度曲线线率会高一点,所以在近距的时候,结构光的相对精度会更好,远距的时候,1.5 米往上,再到 3 米、4 米、5 米,实际上这个结构光精度下降的就会比较快。 要解决一个问题,精度和深度都非常重要,否则也做不了应用。所以,归纳来看,ToF 要解决如何把深度完整性做得更好的问题,把功耗要做低(实际上 ToF 的功耗是一个大问题);而结构光要解决在远距的情况下相对精度如何提高的问题。
关于结构光和 ToF 在智能手机上前后置方案的问题,目前比较常见的是 ToF 放后头、结构光放前头。对此,胡科峰表示,其实 ToF 前置、结构光后置也都是有可能的,这取决于技术发展的程度和手机厂商的实际选择。他表示,其实此前也有传闻称苹果考虑过后置结构光方案;但其实不管是结构光还是 ToF,都是在为整个 3D 阵营造势,都是非常值得欢迎的;实际上,在结构光之外,奥比中光在 ToF 技术上也有自己的布局。
总体来看,在目前的智能手机上,结构光多采用前置方案,主要应用于解锁以及安全支付、3D 人脸建模等方面;而 ToF 方案多被用于智能手机后置;从应用场景上来说,除了用于后置摄影,ToF 技术还在 AR 等领域(包括 3D 拍照、体感游戏等)有一定的作用。
当然,值得强调的是 3D 视觉技术对 AR 领域的推动。
SLAM 将有助于解决右图中的 AR 游戏不合理问题
对于 AR 来说,3D 视觉将会帮助智能手机更好地实现 SLAM(Simultaneous localization and mapping,实时定位和地图构建) 技术——而 SLAM 技术则是 AR 实现的核心。雷锋网 曾经报道 过, 苹果 ARKit 的一大厉害之处是,只通过手机的单目摄像头,结合 IMU,在智能手机上实现 SLAM 技术;而依托于普通摄像头无法比拟的景深信息和建模能力,3D 视觉技术则可以帮助智能手机实现更高级的视觉 SLAM(也称 VSLAM),从而手机上实现各种各样复杂的 AR 应用。
对此,胡科峰也表示,测通过 3D 和 IMU 等的结合,智能手机应用层面的最终方向一定是 AR 这个大方向,而且还要与 5G 结合起来,把 AR 做到非常便利,最终融入到用户的日常使用中去。
追随苹果 Face ID 之后,Android 旗舰「抢先」上马后置 3D 摄像头
2017 年 9 月,随着 iPhone X 的发布,3D 视觉终于在智能手机上体现出它的使用价值;由于苹果在技术上的雄厚实力和它对用户体验的重视,iPhone X 以 3D 结构光技术打造了可以直接用于面部识别的 Face ID,并且迅速取代了 Touch ID。
于是,以消费级的智能手机为着眼点,各大 Android 厂商纷纷开始发力 3D 视觉,基于技术与应用场景的结合,主要以结构光和 ToF 为主。
最早跨出这一步的是荣耀。2017 年 11 月 28 日,荣耀 V10 发布,其中搭载了“点云深度摄像头”的散斑结构光手机配件,具有 3D 人脸识别与解锁、3D 人脸建模等功能。
2018 年 5 月底,小米发布了小米 8 透明探索版,其中搭载了 3D 结构光技术,号称是 Android 首款 Face ID 手机。小米 8 透明探索版采用的是以编码结构光技术,该技术由以色列 Mantis Vision 公司研发。据了解,在 Mantis Vision 的编码结构光系统,点阵投影器和泛光照明器中的 VCSEL 由艾迈斯半导体(ams)提供;近红外摄像头中的全局快门图像传感器由豪威科技(OmniVision)提供。
2018 年 6 月,OPPO Find X 发布,这款旗舰手机的其中一个主要卖点,就是 “FaceKey 3D 结构光”技术和“双轨潜望结构”设计,而背后的供应商是奥比中光,双方是独家合作关系。从应用场景上来看,OPPO Find X 的 3D 结构光主要用于人脸识别解锁、3D 美颜等——而 Find X 的“双轨潜望结构”,则意味着 3D 结构光摄像头模组必须做得比 iPhone X 更薄。
此外,在 2018 年 10 月发布的华为 Mate 20 Pro 机型上,前置 3D 结构光技术也得以搭载。它在功能上也实现了人脸解锁、人脸支付,同时还可以通过 3D 结构光的 3D 景深感测功能来实现实时的 3D 建模;比如拍摄自己的面部表情,生成 3D 表情包。雷锋网了解到,华为带有结构光的机型发射端 VCSEL 由 Lumentum 供应;准直镜 G+P 由联创电子、舜宇光学供应;DOE 由 AMS 和 DNP 供应;接收端感光芯片由豪威科技供应;3D 结构光算法为华为自研;整个 3D 结构光模组由欧菲光和舜宇供应。
不过,在积极探索 3D 结构光的同时,整个业界对更适用于后置摄像头的 ToF 技术的探索也在持续进行(当然有报告中,苹果也在积极部署 ToF 技术);与此同时,随着整个行业在屏幕指纹识别技术上的一步步推进,3D 结构光带来的解锁便利似乎被逐步消解——于是,ToF 技术在 Android 阵营中受到欢迎。
首先上马 ToF 的机型,是 OPPO 在 2018 年 8 月发布的 R17 Pro;基于 ToF 的加持,它在 3D 拍照、立体游戏、AR 应用方面有了一些新的玩法。雷锋网从供应链处获悉,R17 Pro 上的 3D TOF 的摄像头供应商为舜宇光学。
2018 年 12 月 21 日,vivo NEX 双屏版发布,该机型同样搭载了 ToF 技术。由于是前后双屏方案,这款机型也能够实现 ToF 技术辅助下的三摄自拍,并且可以实现 ToF 人脸识别,该人脸识别功能可以实现 24 小时人脸解锁,甚至可以支持支付宝的支付功能。雷锋网了解到,vivo NEX双屏版的摄像头模组由信利国际、欧菲科技和三星电机供应,其中 3D ToF 模组由信利国际独供;其他两颗摄像头模组由欧菲科技和三星电机供应,而三星电机是主供。
vivo NEX 双屏版发布数天之后,华为旗下的品牌荣耀在 2018 年年底的旗舰机型 V20 中也搭载了 ToF 技术,在发布会现场,荣耀现场展示了体感游戏、3D 建模、视频瘦身美体等功能。据了解,在 3D 图像传感器方面,荣耀 V20 和 OPPO R17 Pro 都采用了索尼的 IMX316 传感器,而其模组加工是由欧菲科技、舜宇光学科技来完成——与华为 P30 Pro 的供应商相一致。
值得一提的是,在 2019 年 2 月的三星 S10 发布会上,三星也宣布了一款 S10 5G 版本,这是一款拥有四颗摄像头的手机,其中包含一款可实现 ToF 技术的 3D 摄像头。由于三星在 3D 图像传感器领域的自研优势,ToF 技术极有可能出现在其他的三星手机上,比如说下半年的三星 Note 10。
三星的韩国「妹妹」LG 也不想落人后,走了一条不同的路:在前置摄像头上采用了 ToF 3D 模组,而不是像苹果和其它 Android 厂商那样用了结构光。根据官方介绍, 2 月发布的 LG G8 THINQ 搭载了 ToF 技术的前置摄像头,传感器是 Infineon 的 REAL3。
当然,在最新发布的 P30 Pro 上,华为选择了 ToF 技术。按照华为方面的介绍,华为 P30 Pro 所搭载的 ToF 镜头能够实现如下功能:
-
精准捕获景深信息,让拍出的画面更具层次感;
-
实现专业级的人像虚化,甚至可以精细到发丝;
-
实现 3D 体感游戏,3D 魔术师等功能;
-
利用深度感知功能,实现对物品的长度、高度和面积的测量。
可以看到,华为 P30 Pro 对 ToF 技术的应用主要体现在两个方面,一个是在手机拍照过程中对画面层次感和人像虚化功能的加持,另一方面是基于 3D 成像技术所开辟的其他应用场景,比如说 3D 体感游戏、AR 等。不过,从本质上来看,这两个方面都是离不开 ToF 技术的基本原理,就是对画面深度信息的感知和使用。
根据雷锋网从供应链了解到的信息,华为 P30 Pro 的 ToF 模组关键供应商信息如下:VCSEL 来自 Lumentum;陶瓷盒子来自京瓷;Diffuser 扩散器来自 Viavi Solutions。镜头模组由舜宇,欧菲光提供。尽管如此,华为 P30 Pro 中其他的一些 ToF 技术实现的关键器件(比如说 3D 图像传感器)背后的供应商还并不明确。
另外,一个不得不重点关注的是苹果在 ToF 技术方面的动向。2018 年 11 月,美国专利商标局(USPTO,The United States Patent and Trademark Office)公布了苹果新的专利申请,专利显示,苹果可能使用光学电子元件如 VCSEL 以及 ToF、单光子雪崩二极体(SPAD)为基础的激光 LiDAR 来改进深度摄像头。
如此,苹果什么时候在 iPhone 上马 ToF,则成为业界的另外一个关注点了。
有了 Tango 的前车之鉴,这一次 3D 视觉会在智能手机上普及吗?
2013 年 9 月,苹果在最新发布的 iPhone 5s 机型上搭载了指纹识别技术,一时引爆了指纹识别的行业供应链;短短几年时间,指纹识别就已经从旗舰机型下探到入门机型,最后在智能手机上基本上实现全面普及,成为智能手机的标配。
那么,3D 视觉技术会像指纹识别那样在智能手机上普及吗?
胡科峰表示,仅仅从解锁支付的角度来看,如果指纹技术的出现对解锁体验的提升是 60 分到 80 分的话,那么 3D 视觉带来的面部解锁或支付的提升可能是 85 分到 95 分甚至是 99 分的提升,前者是“吃饱”,后者是“吃好”,显然前者的需求更加强烈,因此普及速度更快。
胡科峰表示,对于智能手机来说,3D 视觉方案的场景除了解锁支付(甚至说解锁支付只是附赠的一个功能),还有很多方面的应用潜力,比如说 AR 游戏、AR 视频通话,但这些应用还没有得到充分的开发,而且还要跟 AI、5G 等技术相结合——如果开发到一定阶段,3D 视觉也会逐渐走向普及。
毫无疑问,3D 视觉已经成为整个智能手机行业正在积极拥抱的一个技术趋势,它也包含着众多的应用潜力,并且会随着 AI 和 5G 的发展找到更大的生机;3D 视觉技术无疑会走向更多的智能手机,但眼下仍然集中于旗舰机型,要想实现在产品定位和价格上的下探,恐怕还需要经历一个较长的过程。
另外,从现有的发展态势来看,智能手机厂商对 3D 视觉的选择已经逐渐从前置的 3D 结构光走向后置的 ToF 技术,这不禁让雷锋网想起了此前已经宣告死亡的 Project Tango——实际上,Google 当年力推的 Project Tango 的量产机型 Phab 2 Pro 正是采用了 ToF 技术,华硕亦有过尝试,但都没有获得好的市场反响。最终 Google 不得不在 2017 年终止 Project Tango 而改用 ARCore 来推进 AR。
所以,最后的问题来了,如今 ToF 技术已经被越来越多的手机厂商所支持,那么 Google 是不是要考虑复活 Project Tango 了?
。