获得天使轮融资,这家公司要为视频直播提供机器“鉴黄师” | 每日黑马
使用了人工智能服务,直播平台在审查内容时,能够节省70%-80%的人力投入。
职业“鉴黄”,是很多人眼中奇特而又隐秘的工作。而实际上,这是一项非常具有挑战性的活儿。一个直播网站,最多时需要五六十人三班倒,24小时持续工作,一个人一小时最多需要审查6万张图片,对用户上传的视频、语音文件、图片做全面审查,还要保证检出率和误报率。而现在,如果由计算机接管这个活儿呢?
极限元智能科技能够为直播平台提供的互联网音视频智能监测系统,就能代替人工,对有害视频进行自动检测和报警,让“鉴黄”这件事儿,不再成为企业的人力成本负担。
这是极限元业务体系中的一项。这家在2014年成立的人工智能公司,在智能语音和计算机视觉等领域,开发了多项消费级智能产品,为网络安全、智能驾驶等提供行业应用。2016年,极限元完成了天使轮融资。
用智能语音识穿电信诈骗
极限元创始人雷臻有过4年在华为的工作经历。离开华为后,雷臻参与联合创办了比特币交易平台OKCoin,到2013年,OKCoin已经成为全球最大的比特币交易所。而从2014年开始,雷臻又再次出发,创办了极限元。
雷臻说自己是个喜欢“折腾”的人。选择2014年在AI领域入局,则是因为他认为,当时的人工智能行业,已经走到了一个临界点。“虽然人工智能早已产生,但是计算资源和数据量还远远不够,也一直没有发展起来。”而随着深度学习的发展,云计算和大数据的深化,计算资源的增长,以及基于深度学习算法的标志性企业的出现,雷臻觉得,人工智能发展的时机到了。
极限元创始人雷臻/受访者供图
“人工智能商业化的应用,现在还只是出于早期阶段。这个赛道是足够大的。”雷臻说。同时,极限元的创业团队基本形成。联合创始人康利强拥有十多年软件研发、架构设计以及项目管理经验;联合创始人马骥曾就职于中科软与华为,是一名网络安全解决方案专家;团队的技术骨干来自于中科院。有了方向和技术人才资源,以及自己的创业经验,雷臻决定向人工智能领域进发。
刚成立时,极限元首先选择的是从智能语音领域切入。公司获得了语音合成、语音识别的相关技术发明和专利,推出了极限元“智能语音云平台”,开放API接口,对移动开发者和软硬件厂商提供技术解决方案。
“极限元是为数不多的能提供整个语音解决方案的公司。”雷臻对 i黑马 说。在语音识别、语音合成、声纹识别、口语评测、语音检索等方面,极限元都能提供相关服务。“在通用领域,我们的语音识别准确率能够达到95%以上。”雷臻说。
极限元的语音解决方案已经在多个领域推出了落地应用。据雷臻介绍,包括极限元联合语文出版社推出的“古诗词诵读APP”和“方言掌上通APP”。前者可以根据用户的语音诵读实现对字词准确性、韵律标准型的评测,同时提供自主学习功能。后者是出于保护方言以及互译的需求,可以帮助用户学习和使用方言,同时可以进行方言和普通话的互译。
安防领域也是极限元智能语音系统应用的重点。极限元推出的反电信诈骗系统,可以通过分析语音内容,判断来电是否为诈骗电话。雷臻表示,目前,该系统已经通过地方公安部门验收,并在几大电信运营商开始部署。
节省80%的“鉴黄师”人力投入
2016年,极限元推出了互联网音视频智能监测系统。这就是我们之前提到过的对直播平台等的内容监测产品。
鉴黄并不想外界所想象的那样有趣,而是一个苦逼活儿。现在,国家互联网管理机构对直播平台的要求日益严格,对事故处于零容忍状态。而直播的需求,却在日益扩大。直播平台们,必须设置专门监控团队,24小时实施人工监视。往往一个工作人员需要负责监督多个直播间,如果出现有害视频画面和语音,必须通过人工确认。因此,监管部门往往是三班倒,据极限元统计,1人1个小时最多要审6万张图片,一天处理40万-50万张直播截图。“小一点的直播平台光监督审核这块,可能就需要40-50人。”
极限元的解决方案能够实现音频+视频的双通道检测。对于视频直播内容,能够识别图像中的人物体征,识别人物肤色和肢体器官的暴露程度,分析动作行为,以及视频中包含的弹幕信息。同时,还可以从音频信息中提取关键特征,判断是否存在敏感信息。主要功能包括实时提取音频数据、音频信号降噪和增强处理、语音关键词检索、通过声纹和人脸对主播身份进行确认登。它能监控所有送检视频并对问题画面自动报警,支持事件回放,方便进行人工校验。
互联网音视频有害信息审查安全网关/受访者供图
“应用了我们的解决方案,大约能够为直播平台节省70%-80%的人力。原来五六十人的监控团队,现在只需要10个人左右即可。机器验证介于‘性感’和‘色情’之间的内容,再需要人工校验。”雷臻告诉i黑马。目前,极限元的解决方案已经在花椒等直播平台得到了应用。
音视频智能监测系统并非仅仅只能在直播平台上得到应用。在雷臻的计划中,它还具有更大的行业外延性。“各种图像、视频的涉黄内容审查场景中,比如公安部门、互联网信息监管部门、内容发布平台网站等,都可以得到应用。”雷臻说。“除了直播外,我们已经在加速泛娱乐行业布局,包括电商平台、社交媒体、游戏等。”视频直播领域,由于近年来成为热门社交领域,视频传播实时性较高,相关部门审查最为严格,因此也成为极限元首先试水的领域。
“我们起初在和网信办的项目合作中,发现了这是一个极大的需求。”雷臻说,“而且,我认为这是一个人工智能能够极大地发挥作用的领域——它的边界足够清晰,而且,数据量足够。”
“边界清晰+大数据”的领域最适于AI落地
在选择人工智能商业化的领域时,雷臻通过自己的技术和创业经验,形成了一套判断方式。而清晰的边界和数据资源,就是他的两大选择标准。“对于鉴黄,法规已经对它进行了明确的界定:允许做什么,不允许做什么,什么样的内容属于色/情的范畴。”雷臻说,“这样,人工智能能够发挥它在算法和效率上的优势。”
其次,音视频直播行业,已经具备了海量数据可以让机器进行训练和学习,不断地迭代和优化。“在智能鉴黄领域,我们的准确率现在能够达到99%,误报率低于1%,极大地节省人力资本。”雷臻说。
同时,极限元还开发了车载疲劳驾驶检测系统。极限元自己开发了硬件,应用基于深度很静网络的监测模型,能够识别人脸、姿态和语音等人体特征,来判断司机是否处于疲劳驾驶状态并进行提示。雷臻表示,极限元采集了超过50万名司机的大数据,能够实现对大部分疲劳驾驶场景的覆盖。
目前,极限元已经拥有超过50名员工,并已经基本实现盈利。随着年初CES2017大展,以及Master在围棋界狂虐了数十名人类选手,人工智能的热度在2017年仍在持续提高。雷臻表示,极限元在接下来的时间里,将在定制化语音与音视频智能监测领域,继续扩展更大的商用空间。
“人工智能是个门槛非常高的领域,它和以往的移动互联网创业有着极大的区别。”雷臻说,“在这个行业里,我认为,不会出现如同当年千团大战一般的创业公司密集出现的情况,这是一片非常广阔的市场。BAT等巨头在通用领域发力,而对于垂直领域,创业公司们都具有极大的机会。”
黑马档案
所属公司: 极限元(北京)智能科技股份有限公司
创始人: 雷臻
所属行业: 人工智能
所属地区: 北京