微信早期员工李明强创办“图普科技”,只要会用Excel,就能训练深度学习的图像识别模型
随着读图时代的到来,大量的内容产生在图片和视频上,对图片的识别、理解和分析需求越来越强烈。一时间,图像识别、深度学习、人工智能成了一线大公司要拿下的战略要地,百度有深度学习研究院,阿里也把《大数据》和《数据之巅》的作者徐子沛挖来任副总裁布局数据挖掘。对一般公司来说,它们往往没有人工智能方面的工程和技术能力,但又有处理大量图片数据的需求,这个矛盾该怎么破?
作为微信创始团队成员之一的李明强创办的“ 图普科技 ”,其2B业务“图像识别开放平台”便是要帮助 企业定制自己的图像识别引擎 ,企业无需聘请人工智能识别的专家组建研发团队,在web界面上即可操作。李明强告诉 36氪 ,“这个图片识别云平台的好处是降低了人工智能的使用门槛,只会用excel的非技术人员经过简单培训就能上手。”
图普开放平台基于图普科技积累的深度学习技术和工程经验,包含标注系统、多GPU并行调度系统、统计和效果分析平台、测试平台和API等。其具体操作流程是:企业用户在申请账号并建立了一个新的识别项目后,再 上传数据(web或sftp)——标注数据(自己打标签)——训练模型——通过云服务调用模型 就可以了。为了保证效果,上传数据和标注数据可以多循环几次,不断优化。关于上传图片数据和打标签举例如下:
色情/非色情
广告、垃圾/正常
风景/人物/食物/汽车/数码/...
有水印/无水印
美女/丑女
欧美范/日韩范/文艺范/潮女范
甚至还有股票的波形:头肩底/圆弧底/W底/...
等等
李明强将这个“图像识别开放平台”比作一个聪明的孩子,企业用户只要上传各种应用场景下的图片数据来“教他”(数据训练),这个孩子看得越多就学得越好,干活也就越靠得住。图普则负责硬件和软件的问题,算法和工程的问题。
目前图普科技的合作伙伴有迅雷、花瓣网和又拍云。拿迅雷的黄色图片监控来说,如果用传统方法,迅雷通常会用到几十个鉴黄师,每位鉴黄师一天能审核两万张图片,而图普科技能为迅雷节省90%的审核人力,一台鉴黄机器每天可以审核五千万张图片,其单个视频处理时间小于1秒,100张图片处理时间小于1秒。加总起来,图普机器人目前每天的处理量是1.2亿张图片、30万个视频,且相对于人工审核98%的准确度,在这种处理速度下图普的准确度是99.5%。
图普科技提供的这种云端服务模式是按照调用次数付费,调用量越大单价月底。如果企业的日调用量是1万起,每张收费标准是1分;日调用量到了千万级别,100张的收费是1分钱。
创始人李明强是原腾讯项目经理和T4技术专家。具有7年的互联网产品项目管理、团队管理、产品设计以及运营推广的经验;腾讯广研敏捷研发流程的实践者,并有3年电信行业经验,05年加入腾讯广州研发中心,同时也是微信立项时的创始成员。
[ 36氪 原创文章,作者: Nicholas]