旷视科技Face++谢忆楠:人工智能的双重驱动力
12月12日,由 经济 观察报、经济观察网、经济观察研究院、经观 新媒体 群主办的“指尖上的 商业 王国――VTime群英汇2017年度新 媒体 盛典暨第四届VTime新橙奖评选”在北京成功举办。北京旷视 科技 有限公司副总裁谢忆楠应邀出席,并以《人工智能双重驱动力》为题发表演讲。
过去的几年,中国的 互联网 市场发生了巨变。移动互联与人工智能在 社交 、视频、购物等领域的爆发,正在迅速对国家的经济建设和人们的生活方式产生深刻变革。旷视科技谢忆楠在演讲开始就直面人们都在议论的有关AI的两个最尖锐问题——是否会取代人类和AI行业的泡沫之说。他以旷视目前及未来的核心业务发展为例:
旷视现阶段正在主推 金融 、物联网、机器人三个核心业务线。我们说AI+金融主要是视频验证,即通过人脸识别在线远核验你的身份,滴滴的司机端和今日头条的记者都在用这种解决方案。
物联网大家可能不太理解什么意思,讲一个小场景,我们公司是没有门禁,没有门卡,就靠脸走进去,行政那边所有的进出情况,也不用统计考勤,到了第二个月,出勤情况就出来了,我们是小办公室,富士康和凯德大厦都用了这套。
还有个大场景就是很多的电影里面,警察要抓一个坏人,正常的情况下是能抓到坏人,摄象头里面有几千万个人,怎么找到这些人,电影里面是把照片塞进去,图象开始转,出来一个信息他在这,去抓就好了,我们就是把电影的桥段实现了。
如果回看我们当时的选择,那时我们面对的场景是所有的公司都想做一个互联网银行,这个场景的问题是说没有线下网点,能否通过技术把场景的问题解决了,如果能够解决就能够帮助这么的 互联网金融 公司在线上做成合规。三年前很关键的词是远程开户,我相信互联网金融公司的同事应该非常了解这件事情,从这点开始看,场景的需求是什么,场景的需求就是远程,实名化,原因是想做互联网金融没有网点,但是技术在这边能否解决这个事情,就是我们需要考虑的。
但在将技术真正从实验室落地到真实场景中也是十分有挑战的。我们原来做的所谓人工智能,大多就是在刷榜单,为什么叫刷榜单?六千道题回答99%以上就可以了。但我们第一个拿到的测试数据是一百万的,600对100万,在需保证同样正确率的情况下对技术和产品是什么样的挑战。
第二个需要我们不断去克服的问题时,要想解决到底这个人是不是跟图片或视频中是同一个人这个场景,比如3·15上用人脸模仿另外一个人脸这种欺骗手段,这时候就需要我们去做所谓的活体验证技术。最初我们公司内有一个15人的技术团队,在蚂蚁待了三个月的时间,把这个东西做出来了,在2015年的时候,蚂蚁金服正式发布了这项技术。那个时候看到人脸识别走到行业里面,或者是走到场景里面来,所要解决的问题,跟之前技术做的积累关系并不大。这是我们遇到的第一个场景,以及如何用技术解决的问题。
我们一定会需要一个对于我们有价值的场景,如果对场景进行细分,会看到人脸识别,或者是视觉的部分,在视觉里面可以做无人驾驶,安防,金融,零售,机器人,现在还有了新的领域是医疗。这个技术因为每个场景不一样,技术的分化结合点也不一样,导致了这个场景有特别大的吸引力,目前解决的问题可能是一小点,未来可能是大的起爆点。
我们在了解了旷视目前为止所做的一些事情之后,再看我们最初提到的两个问题。人工智能是否取代人类?刚才看到了所有的场景,原来没有的,现在看人工智能是可以取代人的一部分工作的,比如那些模式化的工作——视频分析员,验证审核员之类需要批量处理的岗位,但服务员或者说作家这些需要大量实时交互及感性思维的工作,对机器来说还是非常困难的,至少是三年左右不会出现大批量的导致人类失业的事情。第二个问题是现在AI行业有没有泡沫,我们会讲有泡沫,很多场景对人工智能的要求非常高,这是为什么国家能够把人工智能放在国家战略的标准,国家讲这件事,一定不是因为技术发展很好,而是因为真实的看到这个场景,或者这个行业需要新的技术推动的时候,是发展的需要。最后再次感谢经济观察报的邀请,谢谢大家。