人工智能究竟能干什么?这家公司告诉你美颜背后的技术
配图
凤凰科技/王玄璇
突然所有的领域都叫人工智能了,但现在的人工智能就像2008年的移动互联网,还不成熟。
这是创新工场联合创始人、被李开复称赞为“天才”的汪华在上周的一次采访中谈到的,他认为人工智能有点“早熟”,但进入各行各业还需要一段时间。
但这并不妨碍越来越多的公司举起人工智能的标牌,尽管他们连训练机器的数据都没有。
那么,如何判断一家公司是不是人工智能?
商汤科技CEO徐立是这么说的:“你就看他每个月花在标注数据上的钱。”采集(购买)数据当然要花钱,但标注数据——向机器描述什么是一盆花、一个瓶子,让他去学——这需要非常多人力,所需成本远远高于采集数据。而这些又是必须的,因为不做这些机器就没法学习。
徐立说一些投资人按这个方法去筛选,效果不错。
商汤科技就是一家专注于计算机视觉和深度学习原创技术的公司,成立两年多,已将他们的技术用在了各行各业。比如用小咖秀、Faceu戴兔耳朵、吐彩虹,背后就是商汤科技提供在技术。中国银联的人脸识别项目,也是和他们合作。语音识别领域有了科大讯飞,有潜力角逐图像识别战场的,商汤科技算一个。
玩faceu的Anglebaby
诞生于实验室的创业公司
商汤科技诞生于香港中文大学的多媒体实验室,学术研究贯穿了整个公司的发展。
这个实验室在汤晓鸥教授的指导下,从2011年开始将深度学习应用于视觉领域,在2012、2013年IEEE国际计算机视觉与模式识别会议上(ICCV/CVPR)共发表了14篇关于深度学习的文章。让他们变得更为人所知的,是在2014年LFW检测中人脸识别的准确率首次超过人眼。
这些成果引起了资本的注意。公司尚未成立,IDG资本就找上这个团队。投资新技术的IDG合伙人牛奎光找到他们,讨论成立公司的可能性。团队虽然也有这个想法,但并没有想完全通过融资来促成这件事。IDG阐述了资本在加速和背书方面的作用,团队决定成立一个公司。
如果没有资本的加入,他们也会考虑成立公司,“但是增长的速度会慢一些,因为创业的不确定性还是很大。”徐立回忆说。
于是在2014年10月,几个香港中文大学的毕业生、微软前员工加上一些清华毕业的研究人员,成立了商汤科技,当时就已经有了十几人的规模。
而徐立却是在2015年年初加入的。从香港中文大学出来后,徐立在香港新成立的联想研究院工作了两年(从这个效仿微软研究院的研究机构出来的一些人,此后也加入了创业公司担任技术要职,例如大疆创新科技的核心视觉团队)。
商汤科技CEO徐立
徐立和香港中文大学多媒体实验室的成员关系都很好,加入后做了公司CEO。“我觉得我们的团队一开始都很学术,可能是我比较不学术。”徐立说了句玩笑话,实际上徐立本科与硕士、博士分别毕业于上海交通大学和香港中文大学,并继续在香港中文大学做了一段时间博士后,也是学术型创业者。
用AI技术改造的“良田”
要说学术型创业者的优势,眼光和预见性是第一位的。让机器倒咖啡、自己送小孩这些短期内肯定做不到,他们知道哪些行业能被技术颠覆——拍照应用、安防、金融、地图测绘,这些才是现阶段技术能改造的良田。
美图是商汤科技早期合作伙伴之一。在拿到美图的订单后,商汤科技陆续和Faceu、小米相册、华为相册等签订了合作。机器识别出人的五官,然后再加上各种效果,这种玩法已经走进了各种聚会。在360手机上,则可以先拍照后对焦,或者把照片变成大光圈的效果。
商汤科技的客户中,还包括一些做土地规划的企业。一般情况下,地图需要人去标注,开车验证道路、农田,商汤科技利用遥感数据,可以把不同的用地都标注出来,省去人力成本。
尽管商汤科技已经和华为、小米、新浪微博、京东、中国银联、中国移动等开展了合作,但实际上他们的商业化也不过一年。
这是研究和实际应用之间存在的时间差。在公司成立之初,商汤科技也向很多公司推销他们的技术,结果却发现很多研究距离产品化却还有一定距离。只考虑解决问题的研究代码和和讲究效率的工程代码完全是两个概念,这个由博士组成的团队花了一年时间在工程研究上,也有更多微软工程员工加入进来,才慢慢形成较为先进的工程管理模式。
目前,商汤科技和企业的合作模式主要有三种:SaaS模式,商汤科技提供接口,用于身份证识别、卡号识别、票据识别等;终端模式,提供软件、硬件一体的设备;第三类是为公司建立一个超算平台,他们提供服务,金融、安防等领域常用到后两种合作模式。
在商汤科技的办公室里,还有一个尚未完成的体感游戏,只在电脑上装一个软件和一个普通摄像头,就能代替微软的体感游戏设备Kinect,这是商汤科技下一步想要实现的。
在办公室外、商汤科技位于的这条五道口街区“智造大街”上,已经装上了一种叫枪球联动的摄像机。在几百米外,可变焦的球机能清晰抽取目标人脸,与库中数据做对比,或是识别年龄、性别等各种属性。在人来人往的广场上,那些滞留较久的人群会被标上不同颜色,球机瞄准后来张清晰照,没准就能发现什么正在进行中的交易。
现在这些摄像机由商汤科技的子公司商周锐视制造,商汤科技的其他子公司还包括做金融、征信、大数据的Linkface,与东方网力合资的公司深网视界。
配图
商谈科技办公室内展示的智能视频解决方案,能比对目标人物,查看人员流动率
人工智能进入“铺轨道”期
在介绍这些业务时,徐立拿出了给客户看的PPT,向我介绍为什么他们能做到这些。
他说到他们自己的深度学习平台Parrots,如果不是三四年前就开始做,那么他们可能会使用已经成熟的TensorFlow(这个谷歌开发出来用于深度学习的开源框架现在备受追捧),但商汤科技还是用自己的平台更加得心应手。
机器学习需要用到的数据,也是累积的结果。比如商汤科技已经帮4.6亿人进行了身份验证,1.6亿人的数据来自于SaaS服务,另外3亿人的数据来源是中国移动的实名认证合作项目。
去年年底刚完成新一轮1.2亿美元融资的商汤科技现在已有400多位员工,算上实习生等共600人,其中有60多人有博士学位,分研究、工程、销售三部分。目前他们已在京都建立了第一个海外工程部门,并和一些日本的公司达成合作,但徐立并未透露具体公司名称。
徐立在采访中兴致勃勃地讲起深度学习鼻祖Geoffrey Hinton,他做的深度神经网络从上世纪80年代到本世纪初一直不被主流研究认同,直到2011年他和微软做的一个语音识别项目获得成功,由大数据指导的智能模式才代替由人工指导的智能模式,成为主流。
也是在2011年,数据的积累达到一定程度,GPU能承担起深度学习的运算,人工智能时代到来,商汤科技的早期团队才将实验室中将重心放到了这个方向。
现在,人工智能进入了基础设施铺建期,就像火车普及之前的轨道,搭建底层架构需要的经费可能让企业对它望而却步。徐立的判断是,铺轨道的阶段会有三五年,接下来,就是三五十年的繁荣期。那些可能因为人工智能失业的人,正是需要解放出来的劳动力,能够去做更有意义的事。
就在商汤科技办公室的楼下,五道口熙熙攘攘。走在“智造大街”上的人们行色匆匆地赶去地铁站,或是说说笑笑地奔向今晚的饭局。他们不知道的是,这些都被枪球联动摄像机记录了下来。