美团点评用人工智能“搞定”99.6%UGC审核
从AlphaGo击败柯洁,到机器人索非亚获得沙特国籍,人工智能(AI)无疑是2017年 科技 领域最火的词。人工智能越多越多地出现在日常生活、医疗、教育等鲜活的场景里。
以全球领先的 互联网 +生活服务平台美团点评为例,在运用人工智能维护平台内容(UGC)安全,用户评论内容反作弊即打击虚假评论、刷单这方面的技术也日渐成熟,并将逐步对外输出、共享。
据美团点评诚信团队技术人员介绍,内容安全工作主要就是清除平台上的违法违规信息、垃圾信息以及禁售信息等,这其中包括对文本、图片甚至视频内容的准确识别。
在图片识别方面,美团点评主要是通过OCR(光学识别)模拟人的视觉效果,将图片上的文字提取出来变成文本,再通过统计算法对文本进行分类,从而进行判定。“图像、文本的语义识别技术,目前应用已经非常成熟,我们不仅内部使用,还通过美团云对外进行技术输出。”该技术人员透露。
近期,美团点评在图片识别上还有了新突破,引入了感知型哈希算法,可以识别出图片之间是否相似,如果判定是相似违规图片就可以直接进行清除,更加高效智能。
对于视频评论,美团点评采取抽帧的方式进行审查,依据视频长短、画质好坏等不同,计算出相对应的抽帧审核比例。依托人工智能,美团点评已经实现了文字、图片、视频等内容安全的全面覆盖。
据介绍,目前美团点评平台上每天UGC超过300万条,其中99.6%的UGC都可以通过人工智能审核,剩余0.4%的“疑难杂症”则会由人工介入审核。因此,虽然近一年来平台UGC内容增长了4倍,但人工审核团队人员规模却精简了一半。
对于平台而言,内容安全只是第一步。针对少数商家刷好评、利益诱导消费者评论、委托第三方机构刷单炒信、恶意攻击竞争对手等产生的虚假评论,美团点评通过人工智能技术也形成了自己的一套“玩法”。一方面,通过有监督学习针对各个应用场景进行定制化管理;另一方面,无监督学习则可以做到全方位监测,自动发现异常并发出警报。二者相互配合,高效运转。
借助人工智能,美团点评诚信团队已累计处罚违规商户逾7.4万家,累计封禁违规会员账号逾2.2万个,处理违规评价超过6400万条。
分析人士指出,人工智能的优势在于能够不断地自主学习,而学习必须建立在海量实例和数据的基础上,“喂”的数据越多,AI就越聪明。
作为第三方点评模式的开创者,美团点评目前已累积了超过15亿条的历史用户评价。得益于其多年积累的海量内容数据,以及较早就开始把控用户评价质量、积累了大量的标记数据,美团点评在运用人工智能技术打击虚假评论、垃圾信息方面优势明显,处于业内领先地位。
目前,美团点评已经有300多种算法来筛选虚假评论,并且每周会根据统计出来的每个算法的命中率等参数进行算法的迭代和优化,及时跟进识别、防控新出现的虚假评论手法。人工智能像是一双永不闭目的眼睛,时刻盯着平台上的文字、图片、视频等一切可能存在作弊行为的载体。