阿里AI鉴黄师赋能网络违规内容治理:一日审图数亿张-天下网商-赋能网商,成就网商
“这两天有个网红很火,就是阿里AI鉴黄师,它可以用人工智能识别网络上的色情、暴力等违规信息。”在8月21日的“2018网络安全生态峰会”上,阿里巴巴集团首席风险官郑俊芳介绍了阿里安全运用AI技术解决内容治理这一问题的新成果。
“随着人工智能第三次浪潮的兴起,新的AI技术如雨后春笋般涌现,能够以一种截然不同的方式,应用于网络内容安全领域。”在峰会当天下午的“AI与内容治理”议题上,中国互联网协会副秘书长宋茂恩发布《AI技术赋能网络内容安全保障研究报告》(以下简称“报告”),介绍了当前AI技术在推动网络内容治理上的新发展。
2018网络安全生态峰会“AI与内容治理”圆桌论坛
语音鉴黄可识别多国语言、多地方言
以往,传统的人工鉴黄师通过一双肉眼鉴别色情图片和视频。听起来像是“福利”,但实际上并不轻松。
伴随着互联网上社交媒体、直播、短视频的发展,每天光上传的图片就超过10亿张,发文数量超过5亿条,不少色情、暴力等内容充斥其中。人工鉴黄师一天一人审核1万张图片的工作量,远远满足不了这一需求。
2015年10月,阿里巴巴“绿网”上线,用人工智能识别网络上包括色情、暴力在内的违规信息,阿里AI鉴黄师应运而生。
AI鉴黄师每天可审核数亿张图片,识别准确率高于99.5%。举个例子,一天要审核4亿张图片的话,单纯由人工来审,一人一天审1万张,需要4万人,而AI鉴黄只需将其中20万张可疑的图片筛出来,由人工再审一道,这需要20人即可。
近日,阿里AI鉴黄语音反垃圾服务上线公测,通过声纹识别技术,阿里AI鉴黄语音能识别语音中存在的涉黄、广告等违规信息,既能听懂中文、日文、英文、俄文等多国语言,还能分辨湖南、湖北、河南、东北、四川、广东等地方言。
阿里AI技术赋能解决社会问题
近年来,互联网上的数据呈现爆炸式增长。报告显示,当前每天通过互联网上传的视频、图片、文字数据超过15亿条,且数据量还在呈指数级增长趋势。
数字鸿沟、不良信息泛滥、数据隐私侵犯、网络暴力和犯罪等一系列社会风险和隐患,比以往任何时候都要突出。
宋茂恩指出,网络内容具有即时性、海量性和多态性等特点,而网络内容安全管理面临审核标准差异化、动态化,对抗行为较为突出的特点。这样的现实情况,意味着传统基于人工审核、人工特征工程的网络内容分析方法,面临极大的挑战。
“面对新形势,人工智能将大显神通。”阿里巴巴集团资深算法专家薛晖介绍,阿里巴巴云盾内容安全基于深度学习技术及阿里巴巴多年的海量数据支撑,提供图片、视频、文字等多媒体的内容风险智能识别服务,能有效降低色情、暴恐等违规行为,为互联网内容的健康性、有效性、合规性提供技术支持。
“未来,阿里AI技术能在内容治理上发挥更大的作用,通过联通线上线下,解决当前凸显的社会问题。”薛晖说。
除了AI鉴黄师外,在人工智能领域,阿里安全开发的人脸识别技术,在金融、医疗、教育、安防等多个行业已开始了实质性的使用;不久前发布的“人脸识别技术”3.0版,通过深度学习能认证出98.31%的人脸,误检率低于十万分之一,仍保持“零失误”纪录。
“今年和明年,将是人脸识别的爆发期,我们会看到更多人脸识别场景的应用。”阿里巴巴安全部高级算法专家觉奥大胆猜测,三至五年后,人脸识别技术的应用将到处都是,“刷脸时代”正大踏步地向我们走来。