“快播案”后开始创业,他要帮女主播穿上衣服
图普科技创始成员李明强
图普科技
创始人:李明强
背景:腾讯T4技术专家,QQ邮箱项目负责人,微信立项创始成员之一
门派:AI图像识别
投资方:晨兴资本、北极光创投
融资规模:A轮千万美金
李明强接招
1、目前图像识别服务是怎样收费的?
2、如何与巨头展开竞争?
3、与晨兴资本、北极光创投的投资是如何谈成的?
点击打开第一个房间,看似清纯的一个姑娘边唱歌边在感谢刷礼物的观众,承诺着礼物到达一定额度后可以解锁主播新姿势;右边的房间女主播穿着性感的制服跳着舞在挑逗着每一位看客,屏幕中充满诱惑的弹幕此起彼伏;第三个房间的MC是某电竞游戏的知名女主播,此刻她刚结束战局之后和房间内的看客「大尺度」地互动调侃……放眼望去,各平台直播房间相加何止千万,而其中大多却又在「情色」之间擦边。
全民直播潮之下,礼物与弹幕齐飞,主播共看客一「色」。
直到2016年斗鱼平台惊现「直播造人」后,互联网涉黄鉴别的难题又一次涌现在众人面前。
「2014年的时候,快播的那个案件启发到我们。」图普科技创始成员李明强告诉《接招》,「传统互联网鉴黄主要依靠各平台的鉴黄师,不仅费时费力,还对从业者的身体有很大影响。所以当时我们想如果把AI图像识别应用到鉴黄领域既可以节省成本,又能大幅度提升准确率和效率。」
李明强2012年底离开腾讯后便一头扎进计算机图像识别领域,创业的第一个项目是叫做「最美搜衣」的智能图片购物搜索工具,用户可以通过其图片搜索功能在海量商品中快速找到同款、相似款,同时还对淘宝的服装信息做全面收录,方便购物者查找及比价,快速找到最适合的商品。
但是在发展的过程中,李明强渐渐发现为女性用户做图片搜索带动商品推荐是一件「不是技术可以解决的活儿」,「我们抓取了京东、淘宝大量数据,建立了一个庞大的图像上的特征库,并且根据图像的区别打上不同的标签……但我们忽略了女性用户对于衣物感性的一面,很多时候我们计算出来相似的衣物在女孩看来是千差万别的。」
转向互联网鉴黄是快播案后李明强当即立下的决定,好在虽然是两个方向,底层的技术却是相同的。DEMO产品没过多久便研发完毕,第一个客户就是久受「鉴黄诟病」之扰的迅雷。
迅雷作为中国最大的下载工具,其每天需要鉴别的内容量十分庞大。「在我们之前也有一些团队提出解决方案,但是传统的技术都不太靠谱。软件召回和误判高达60%-70%,实际用的意义不大。」
在移动互联网兴起之前,已经有许多创业团队开始在计算机图像识别鉴黄领域探讨,其中最受人瞩目的便是绿坝花季护航。2008年工信部斥资4170万人民币采购「绿坝-花季护航」软件,提供给网民免费下载。这款软件的初衷是为了保护未成年人在互联网不受非法、暴力、色情等信息的骚扰,但其糟糕的识别率和不够稳定的系统在其面世不久后便成为行业内和用户群中的笑话。
「绿坝对于图片是用颜色直方图的手段来识别,比如说图片中黄颜色的面积的比例,但是准确率比较低,要么误判很多,要么就漏判很多。」李明强说道,「图普科技用的是人工智能领域的新算法,深度学习算法,通过模拟人脑神经网络,构建具有高层次表现力的模型,能够对高复杂度数据形成良好的识别与解读。」
图普科技的Demo产品递给迅雷之后效果非常好,虽然距离商用还有些差距,但是作为一个解决方案来说,迅雷看到这项解决方案的可行之处。彼时,恰好是国家对互联网内容审查较严,高压之下,迅雷对李明强的团队提出了要求。
「迅雷希望我们能在两周之内完善整个方案,但是当时我们的团队只有不到10个人,并且完善产品时需要大量的数据,我们短时间内根本难以搜集。」李明强坦言当时「压力山大」,好在关键时刻这个已经在纳斯达克上市的合作方(迅雷)伸出了援手。
「迅雷把他们积累的大量数据直接传到我们这边,后期甚至觉得网上传输数据速度不够快,直接将数据拷贝成硬盘寄给我们,让我们赶时间内把这个效果优化好。」
通过利用海量的数据,团队不断的加班加点,最终在规定时间之内把第一个版本做出来,与迅雷建立了正式的合作。而这第一个版本大约可以帮迅雷省掉85%的人力。「经过多个版本的优化之后,现在我们已经可以做到节省95%的人工复审成本了。」李明强补充到。
随后短视频和直播的兴起,给了他更大的空间去施展拳脚;并且移动互联网之后电商和新闻等各平台对图像数据识别的要求也在提高,如今除了UGC智能审核解决方案(包含色情内容过滤)之外,图普还提供图片增值和图像搜索等多样性服务。自2015年上线至今,陆续与今日头条、美图、58同城、迅雷、酷狗、秒拍、唱吧、花椒、Bilibili等数百家互联网企业和政企机构建立合作。如今图普日均图像接口调用9亿次,累计处理超过1000亿图像。在2016年9月获得晨兴资本领投、北极光创投跟投的千万美元A轮融资。
李明强在创业之前曾是腾讯T4技术专家,QQ邮箱项目负责人,微信立项创始成员之一。在腾讯内部的几个项目获得好评之后,丰厚的待遇和规律的生活并没有掩盖住他内心的不安。「做一件有想象力并且值得投入时间去做的事儿」成为了他的目标。
「当时计算机对文字已经理解的相当好了,对语音的识别也有相当丰富的了解和应用场景拓展。但是,计算机对图像的理解,还是一个瞎子。当时我就觉得,这个缺口一定会被堵上。」
李明强认为随着大数据、高性能计算的能力、算法的不断提升,AI将会是暨蒸汽革命、电气革命、信息科技革命后的第四次工业革命,「我们现在做的就是未来的事情。」说到这,李明强笑了笑。
Q:目前图像识别服务是怎样收费的?
李:我们的指标是按图片的实际调用量收费,月付费或包年均可。最初我们按照帮助企业节省多少人力去评判的,这一收费标准也是我们在行业内首创的。我们做人工智能图像识别时把结果分为两个部分,确定的部分我们就收替代人工的钱。比如说企业人工审核一个人一个月成本是一万块钱,我们服务会按照比例收取50%的费用。不确定那一部分,我们只收一个很低的参考价格。
这个模式也是我们率先提出的,这样避免很多提供人工智能的服务的企业找不到应用场景和商业模式的尴尬局面。
Q:互联网巨头在数据量积累方面已经耕耘多时,如果他们进入该领域如何应对?
李:其实像阿里、腾讯这样的巨头也在提供和我们类似的服务,所以早已经跟巨头在竞争。
但是企业服务是要持续去运营的事情,在这个方面巨头不会比我们有优势。他们的科研部门,团队人数也许跟我们差不多,但是他们所要研发支撑的东西首先是他们公司里面这些业务,不会像图普这样一个中立的第三方,专门为互联网领域的企业定制其所需要的方案。
而且经过我们多年数据积累和算法的优化迭代,我们在快速成长的过程中积累到的这些资源是大公司没有的。图像识别它不是一个简单的算法,算法只是一个没有经过雕琢的玉,这里面要靠不断数据的测试才能累积起来。
Q:与晨兴资本、北极光创投的投资是如何谈成的?
李:我们的两个投资人(晨兴、北极光)都是优秀的美元的基金,他们比较关注技术和高新科技的项目,所以能理解我们做的这个模式,对于互联网视频时代的价值和意义在什么地方。
并且晨兴资本很多的投资公司都是我们的客户,比如说像小米、秒拍、迅雷等。他们做调研的时候,可以直接去问这些企业的创始人,使用了图普服务后最真实的感受,得到也都是正面的反馈。
他们了解这一领域的价值,并且欣赏我们的团队和产品,所以很快速的达成了合作。
Q:你觉得人工智能的浪潮何时会被用户感知?
李:我觉得现在用户很多都已经在享用AI的产品了,只是目前AI更多是以一种AI+的形式出现在了用户面前。
AI+可以加到任何的产品上去,并不是固有存在的。比如说大家用的今日头条或者是百度的和谷歌的搜索产品,也许界面UI看起来跟以前一样,但其所应用到的AI技术可以使里面的信息和推送人群更加精准。我觉得AI会以这样的方式逐渐的进入到大家的视野里去。并不是爆发而是渐变式的发现。
从历史的长河去看,每个节点都会产生翻天覆地的变化,但是在这个过程中人的感知是比较缓慢的。但是,在人工智能这个时代开启的过程中,可能会有一些标志性的事件让大多数人印象深刻,从而感知的到。