优图: 腾讯背后的人脸识别技术支持团队

36氪  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

腾讯优图 是腾讯内部专注于图像处理、模式识别、机器学习、数据挖掘等领域的核心技术团队,隶属于腾讯社交网络事业群,主要基于整个腾讯的社交网络平台,为QQ、QQ空间 、QQ音乐、财付通、微众银行等提供图像和模式识别技术支持。

去年因为一个偶然的机会,36氪和“优图团队”进行了接触。一年之后,国内围绕人脸识别展开的商业竞争日益激烈,作为腾讯背后的技术支持,优图将发挥重要的作用。近期,我们再次走访了腾讯优图上海团队,采访了优图团队的负责人黄飞跃。

目前优图在人脸识别方面能做到什么水平?

黄:优图的人脸识别在LFW上达到99.5%以上的准确率,稳居世界前列;在实际应用场景中也已经成熟并技术落地,即将在微众银行、财付通等相关产品中外发。相关技术组成如人脸检测、五官定位、特征提取比对、活体检测等等都达到世界顶级水平。

现在做人脸识别可以说是“站在巨人的肩膀上”,基本上都是先找到算法,再做自适应的场景,再通过大量的数据进行训练。算法本身,找到业界主流的算法后,技术水平的差异未必那么大。但对数据和应用场景的理解和适配就相对更困难。当然很多算法也不是每个人都能做,这需要有比较多的积累,加上实际的解决方案结合。一般人照着论文follow,也未必能做的出来。除了技术门槛,这件事也有数据门槛。

相比于其他团队,优图有自己的强项。第一,依托腾讯平台,算法模型落地到产品形成很好的闭环,所以优图的技术最贴合实际用户。第二,优图人脸识别技术在微众银行、财付通等产品中即将外发,是最快大规模实用的,这也说明我们的技术水平已经达到可实用水平。第三,活体检测是人脸识别实际应用很关键的一步,这方面腾讯优图有自主创新方案,有效结合语音、唇语、面部表情等各种手段,可以立体化的防范照片、视频和人头模型的攻击,使用的产品体验也更好。

优图的人脸识别技术商用时,如何与大数据结合保证安全?

黄:人脸识别本身只是实际应用里的一个环节。在特定数据集上,错误率、准确率都是比较固定的,如果不做业务应用的话,最核心的是算法而未必是大数据。

但是如果要在实际业务中应用,就一定要有相当规模的和实际应用场景一致的训练数据,这才能保证人脸识别算法在这个应用场景中效果足够好。

另外,在实际业务中应用,人脸识别结果也可以同时结合用户的其它信息来提供更精准的结果。

比如从业务的角度,如果是做开户或者支付,就需要有严格的审查。假设一个人经常被拉近黑名单或者经常推销广告,这就说明他的信用未必好,就需要进行额外的审核。也许他除了自动人脸识别以外,还需要通过人工审核。

我们的人脸识别会和腾讯征信、财付通等合作。这就可以运用更多海量信息来分析,比如根据在线、消费、社交等情况,对用户做信用评估。比如,这个用户在浏览器看过什么网页,买过什么商品,好友情况等等,都会反应用户的信用。

这样,人脸识别结合用户分析可以得出更安全的结果。

优图的人脸识别技术如何推广落地?

黄:现在的出口主要是腾讯征信、财付通、微众银行。今年6月会有产品落地。之后也会通过腾讯优图开放平台和腾讯云对外做开放,将我们的图像识别技术开放出来。

其他的方向会比较看好智能家居、安防监控、相册管理等。

与做人脸识别的初创公司不同,背靠腾讯这座大山,在资源和业务方面都能得到很好的支持。尤其是在前期落地时,可以不用考虑收入和盈利的问题,同时也能获得外部合作伙伴的信任,谈较深入的合作。

除了金融,优图的人脸识别还会落地到政务么?

黄:  有可能。我们主要是做技术,商业化主要在腾讯云。腾讯云可能会和各级政府机关达成合作。

另外,目前腾讯已经和公安部所属的全国公民身份证号码查询服务中心达成人像比对服务的战略合作,我们的人脸识别技术可以7×24小时接入公安部查询服务中心的数据库。

除了人脸识别,优图还在研究其他的技术领域么?

黄:我们还在做基于深度学习研究的图像理解和分类。以及在QQ音乐上的哼唱检索、类别识别和个性化推荐。通过分析音乐的信息,识别出歌曲类别,比如流行、摇滚,打上标签。另外通过用户行为知道他喜欢什么歌,也可以更好的帮他做推荐。

Image title

作为大公司背后的技术团队,优图确定技术方向的逻辑是什么?

黄:一方面,我们团队有相当大的自主权,在音视频多媒体大数据这个框架下可以做各种技术研发和落地尝试,老板会支持员工或者团队做较多尝试。我也在一直给团队传达这个理念。我们也会实时关注时事动态,与热点做一些结合。

另一方面,也会与业务一起确定需求。每周都会有业务来找我们提需求。比如,我们在2012年做的智能剪裁,传统剪裁缩略图的方法是直接中间截图,但实际的图片中可能是照片上的人在图片的一边而非中央,所以就需要用智能剪裁技术裁剪更好的缩略图。当时QQ空间提出了这个需求,我们觉得很好就做了,而且这个技术并不难。但是对于业务带来的好处很大。

很多时候这两种情况时并存有交叠的,更多的是我们自发推动的。

当然,还会考虑到布局。我们是一个一个项目推进,这样就能连成一条线,可以逐步加大加深团队的积累。比如做了人脸识别之后,我们又做了活体检测。做对了大方向之后,很多东西就是水到渠成的事情了。

原创文章,作者:小石头

随意打赏

提交建议
微信扫一扫,分享给好友吧。