一线 | 旷视科技成OPPO 3D结构光FaceID供应商
腾讯《一线》卜祥
7月3日,旷视科技发布消息,称OPPO Find X手机上的人脸识别应用由OPPO研究院上海软件研究中心AI实验室与旷视科技Face++联合研发,海外版和国行版的 OPPO Find X 都具备了毫秒极速解锁和百万分之一精度的安全支付功能。
为了让手机像人一样获得三维立体的图像信息,手机厂商们接连推出了双摄方案,虽然双目摄像头能够依据视差原理形成三维图像,但是受制于光线和纹理等拍摄环境因素,双摄产生的三维图像差强人意,更无法满足3D验真环节的应用要求,所以采用主动投射编码光获取3D信息的结构光技术成为智能手机革新的关键一环。
在应用中,3D结构光的整个系统包含结构光投影设备、摄像机、图像采集和处理系统。通过投影设备的发射光线到被测物体上,摄像机拍摄在被测物体上形成的三维光图形,拍摄图像经采集处理系统处理后便能够获得被测物体表面数据形成三维的图像信息。简单来讲3D结构光的实现原理类似于海底探测的声呐系统是通过反射信息来确定深度的,只不过3D结构光在手机人脸识别上的应用,是通过人脸表现反射光线来确定深度信息的。 相比双目来说,其效果在同样的场景下能够得到更完整、更细腻的深度图。
今年5月10日的一次媒体见面会中,OPPO 就曾向大众演示了全球首个基于 3D 结构光技术的 5G 视频通话,并宣布 OPPO 的3D结构光技术已经具备量产条件。而今天,OPPO Find X 的全面问世不仅兑现了 OPPO 承诺,更彻底打破了安卓阵营结构光技术短板的局面,这项技术自此再也不是 iPhone X 的专属功能。
相比传统人脸识别,OPPO Find X 的 3D结构光技术可应用于安全支付、三维重建、AR、游戏等众多场景,其中最重要的应用是便是安全支付,这便要求3D结构光人脸识别算法具备极高的技术水准,并做到严格的质量控制。
OPPO官方介绍,在 Find X 可升降的双轨潜望结构中安装了泛光感应元件(Flood illuminator),红外摄像头(infrared camera)、测距传感器(ranging sensor)、点阵投影器(dot projecter),采用 3D 结构光技术,通过向人脸投射 15,000 个光点,给用户的面部构建立毫米级精度的 3D 深度图,实现更为精确地识别用户的生物特征,并快速与主人信息进行比对,实现了免接触、更安全的解锁。
“世界上60%的摄像头是用在手机上面的。”旷视科技云事业部高级副总裁吴文昊表示,“短期来看,旷视的首要任务就是赋能全球十亿摄像头,所以手机市场一定是主战场。”2017年中,旷视科技开始布局手机市场,随后基于核心的深度学习和计算机视觉技术一举推出人脸支付、人脸识别解锁、人像光效、人像背景虚化、视频美化、3D Animoji等一系列移动端AI产品,以满足不同手机厂商在人脸解锁、图像增强、相机增强、智能图像和视频处理上的需求。
为了满足OPPO极致的产品需求,旷视科技手机解锁团队攻关数月,完成了逾十亿张人脸数据的训练和 60 万张 benchmark 测试,最终实现了0.1秒内极速识别、0.03秒重建,和误识率低于百万分之一的高精度安全面部识别。
搭载旷视科技3D结构光人脸识别方案的 OPPO Find X 可通过前置的 RGB、红外和结构光摄像头同时采集到人脸的色彩图片、红外图片和 3D 信息,并快速从输入的人脸红外特征信息与深度信息中提取个人的安全识别特征,安全特征具有10000+维度信息,算法会将提取的安全信息与录入时安全信息进行匹配决定是否安全认证通过。
在体验上,无论是录入还是解锁都在顷刻间完成,甚至在暗光环境下也几乎不受影响,解锁效率相比现在的人脸识别大大提升。而在安全性上,旷视给出的 3D 结构光人脸识别方案无论是在解锁还是在支付应用中都可以有效抵御照片、视频甚至定制化硅胶面具和 3D 打印面具等形式的攻击。
拿到OPPO 大单只是旷视科技人脸识别技术应用的一部分,这家公司还做了人脸识别另一种方案,就是和结构光竞争的TOF方案。
在刚结束的上海MWC上,vivo手机公司展示了TOF技术,据腾讯《一线》了解,这项技术也由旷视提供支持。
vivo 在2018 MWC 上海发布了 TOF 3D 超感应技术。在现场,用户只需要站上 vivo 的体验机,摇臂上搭载了 TOF 3D 超感应技术的原型机就会对用户的头部进行环形扫描,录入之后很快就会形成一个高精度的 3D 人脸模型,轮廓和细节的把控都十分出色,用户还可以拖动模型查看任一角度的自己。
除了3D建模,旷视(Face++ )与 vivo 在这一次的 MWC 中推出了一整套移动端 3D 创新产品,并首次在业内实现依托于(TOF)3D 摄像头方案的安全支付、3D 美颜、3D 整形和 3D 光效等应用。
iPhone X 的 3D 结构光可感应 3 万个有效深度信息点,vivo TOF 则是 30 万个,因此它能构建更清晰、细节更丰富的 3D 立体图像;
vivo TOF 的识别距离更远,可达到 3 米。
最重要的一点,由于 vivo TOF 模组的 baseline(基线,可简单理解为发射器和接收器的距离)近乎为零,因此模组体积更小,相比 3D 结构光的 25mm 小太多了。
在 3D 支付产品的开发中,vivo 手机在旷视三个核心算法模型结构加持下,可实现 0.1s 内极速识别,0.03s 重建和达百万分之一的支付精度,包括多尺度多特征的注意力检测模型,可自适应网络、多模型融合的识别方案,以及基于业界开创性的移动卷积神经网络 ShuffleNet 定制开发的活体检测模型。有了这项技术,vivo 用户将可以用人脸替代指纹、密码或 PIN 码作为移动支付的主要验证方式。
旷视认为真正的AI加3D时代刚刚开始。