声网推一站式智能语音识别方案 用AI高效助力内容审核

砍柴网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

近日,全球实时音视频开创者声网Agora宣布推出一站式智能语音识别解决方案,将通过AI智能降噪、声纹检测、语音识别等技术,进行在线实时语音识别,帮助平台更智能、高效的识别语音中存在的涉黄、涉政、广告等违法违规信息。净化平台内容质量,降低监管风险,提升用户体验

音频行业监管难 高效内容审核成平台刚需

一段时间以来,网络音频行业乱象频出。今年6月,国家网信办针对网络音频乱象问题启动专项整治行动,26款音频平台因传播历史虚无主义、淫秽色情等内容被采取约谈、下架、关停等处罚。

一方面,随着移动 互联网 的发展,UGC内容生产数量越来越庞大,ASMR、娇喘等色情擦边球内容频频出现在语音聊天室、直播、短视频等平台上;另一方面,相对于图文和视频,音频审核本身在技术上也更具难度,这大大增加了平台方的内容审核压力。因此,在国家网信办强监管的大背景下,借助更高效、便捷的语音鉴黄方案加强内容审核成为众多 社交 、音视频平台的刚需。

一站式智能语音识别解决方案,大力节约成本

无论传统语音审核还是人工审核方案,一直以来各平台都在积极寻找更高效的内容审核方式。在传统审核方案的对接模式中,企业想要同时上线直播、鉴黄等功能,需要分别对接CDN厂商、RTC厂商和内容审核厂商,并且额外支付CDN拉流成本,通过三步才能拿到内容审核结果,步骤繁琐、时间成本高且面临故障风险。而单纯使用人工鉴黄虽然对新型问题有较强的灵活性,但也面临人员流动性大、质量效率不稳定等运营成本。

声网Agora的一站式智能语音识别解决方案,将上述传统语音审核和纯人工语音审核进行了优化升级,通过自建的全球虚拟实时通信网络SD-RTN™,整合目前业界TOP3智能语音识别服务商,为企业提供可集成实时音视频、实时录制和实时智能语音识别的一站式服务,提供市面上最高效、便捷的智能语音识别技术。

声网推一站式智能语音识别方案 用AI高效助力内容审核

同时,声网也是目前唯一一家打通人工智能、实时语音识别、实时音视频三大技术解决方案的服务商。使用声网的一站式服务,企业无需部署额外SDK、无需自己对接CDN厂商、更无需支付拉流成本,就可同时上线直播(实时音视频)和鉴黄(实时语音识别)功能,帮助企业大幅节省接入成本,真正做到一站式方便接入。

独特AI降噪技术,提升不良信息识别率

在目前流行的众多K歌平台,直播、语音聊天室中,为了追求内容效果,用户在UGC内容创作时普遍都会使用背景音乐或音效来营造氛围,这对平台进行语音识别增加了难度。

对于语音识别中常见的噪声、背景音等音质问题,声网的一站式智能语音识别解决方案融合声网Agora语音引擎与AI音频降噪算法,可提供去除背景音、环境音之后的高音质音频源,在原来算法的基础上将不良信息的识别率有效提高30%以上。

在语音识别过程中,对于有语义的声音,系统先将语音识别转成文字,然后再对文字内容进行识别;而对于无语义的声音,例如娇喘、ASMR中的色情擦边球等,则可以通过声纹检测来进行识别,再通过内容安全引擎判断是否包含涉黄违法内容。这样“双管齐下”的方式,可以避免娇喘等无语义声音的特殊性带来的审核漏洞。

声网通过深度学习语音识别技术与在线实时语音分析,智能识别语音环境中的广告、涉黄、涉政、暴恐、谩骂等不良信息,保障语音聊天室、娱乐直播等语音应用绿色安全。未来,声网还会联合更多业界知名智能语音识别服务商,为企业持续提供高效、严格的内容审核机制,促进网络生态健康发展。

关于声网

声网Agora成立于2014年,是一家为企业及开发者提供全球范围实时音视频云服务的技术服务商。通过声网Agora SDK,开发者最快只需要30分钟即可在全球范围内轻松地为任何移动、Web或桌面应用程序嵌入实时音视频社交、全互动直播、 游戏 语音、AR远程协作、视频报警、视频客服、机器人视频陪伴等。

声网Agora的全球客户包括包括小米、陌陌、斗鱼、完美世界、阿里游戏、faceu、好未来、VIPKID、The Meet Group(美国最大的婚恋社交平台)、Hike Messenger(印度“ 微信 ”)、Badoo(全球最大约会应用)、musical.ly(北美短视频平台)、LisPon(日本二次元音频社区)、Stager Live(日本直播平台)等近百家国内外企业。

随意打赏

ai智能语音机器人百度ai语音识别语音控制智能家居云知声语音识别智能语音机器人信息化解决方案语音识别应用开源语音识别小米ai音箱智能语音系统
提交建议
微信扫一扫,分享给好友吧。