向“音”而生 数美科技护航实时语音社交平台发展

砍柴网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

2021年初,音频 社交 应用Clubhouse迅速冲击 互联网 圈,在马斯克入驻的名人效应和自身独特的邀请注册与推荐机制双重加持下,Clubhouse的讨论迅速在中国火热蔓延开来,“音频社交”赛道引爆业界关注,国内互联网圈迅速开启军备竞赛,抓住音频社交领域的新机遇。

但值得所有即时性音频社交平台关注的是,Clubhouse在国内的火爆犹如烟花般绚烂且短暂。由于信息智能管理的缺失,Clubhouse的讨论房间多次出现风险内容,几经周折最终在国内被暂停服务。自此,爆火中文社交网络的Clubhouse热度大减,不复往日繁荣。

为了抓住音频社交领域的新机遇,国内互联网圈迅速开启军备竞赛,纷纷开始尝试打造国内版的“Clubhouse”。 映客直播上线对话吧; 金融 信息服务提供商鲸准推出Capital coffee;小米刚刚结束服务的即时通讯软件米聊在几天后即重新上线,打造与Clubhouse有高度相似的语音聊天软件……

面临的挑战

实时语音社交平台,每天都会产出海量聊天信息,聊天内容很容易失控,极有可能混有敏感信息和灰色内容,不利于平台业务的发展,对网络环境造成威胁。由此可见,敏感信息过滤已经成为影响平台业务发展的风险线,也必将成为语音社交平台运营发展中的重要模块。

面对海量增长的音频消费和使用需求,音频内容审核迫在眉睫,但平台的风控系统往往会遇到以下两大方面的困境:

1.敏感信息过滤

人力投入成本高:音频内容数据量大,人工日均审核量有限

实时响应要求高:内容复杂多元,及时响应时事政策难度大

培训投入成本高:人审理解能力参差不齐,培训投入成本大

2.平台运营管理

专业程度要求高:实时流内容风控难度大,自研投入成本高

风险应急能力弱:突发违规处理能力弱,危机应对经验不足

审核效果需求严:兼顾风控与体验,高实时与高产能难两全

语音审核除了要识别音频包含的文本内容是否涉及敏感信息,同时还存在语音语调上的拟声词、感叹词和语气词的审核难度,例如涉及色情信息的娇喘、呻吟等。这为语音审核提出了更高的挑战。目前普遍采用的人工审核方式虽然能够提供较好的审核能力,但需要对音频文件进行整段察验,对音频流进行实时监控,造成了较高的时间成本和人力投入。

数美实时语音社交平台内容风控专项解决方案

对此,数美 科技 经过多年在内容风控领域的深厚积累和持续自我升级,开发了基于深度学习与画像的全栈式智能音频风控解决方案,能够精准识别色情、违禁等内容风险与垃圾广告信息,实现高效、准确、全面覆盖的内容审核过滤,帮助平台防御音频内容风险。

向“音”而生 数美科技护航实时语音社交平台发展

方案架构

在语音内容获取上,数美科技的智能音频过滤技术支持OGG、MP3、ASF、WMA、WAV、MP3PRO、RM、REAL、APE、MODULE、MIDI、VQF等多种音频格式和音频流,能够应对不同语音内容提供平台使用的常用音频格式,同时支持语音直播实时监控、语音点播、语音消息和各种音频文件的检测。

除此之外,智能音频识别还整合了业界一流的语音识别技术、大规模GPU计算的深度学习、基于敏感词库的名单服务、特殊声音识别模型、基于深度学习的NLP模型以及实时分布式规则引擎等。其中深度学习模型能够让系统从多个维度检测语义环境,准确识别说话意图。而智能音频识别技术根据不同场景和行业采用了专门化的判断策略,结合强大的标签体系能够为不同类型社交平台提供定制化的过滤服务。

向“音”而生 数美科技护航实时语音社交平台发展

音频内容识别组成

在获取到待检测的音频文件和音频流后,主要从四个方面进行内容的检测识别:

1.违禁违规

利用语音转文本技术将语音信息转为文本信息,再通过成熟的文本内容检测,对音频中出现的多种类型违规内容进行检测。

2.涉黄违规

利用大规模GPU集群的计算能力和深度学习技术,准确快速稳定地识别音频中出现的色情,低俗或性感部分,在管理后台对其进行标注和反馈,从而大规模提升人工审核团队效率,增强用户浏览体验。

3.特殊声音识别

同样利用大规模GPU集群的强大计算能力和深度机器学习的技术,除了一般的涉黄违规语言内容,还能准确识别出娇喘、呻吟等非文本类的特殊声音。

4.导流广告

通过语音转文本技术将语音信息转为文本信息,对文本内容进行关键词检测,识别出潜在的添加 微信 号、QQ号、QQ群以及虚假信息等导流广告音频内容。

智能音频过滤技术对问题音频判断的正确率以及反馈的正确率均高于90%。保证高正确率的同时, 还提供了高处理效率,智能音频过滤API的最快响应时间不超过1s,超时率低于0.01%,而智能音频过滤API也具有深厚的处理容量,默认支持并发100路处理任务,还可根据需求动态扩容。

同时,数美即时语音社交平台内容风控专项解决方案也具备以下四大特点:

极速先行:毫秒级系统回调响应,7*24小时全天候服务。

强势驱动:采用高性能应用计算、全栈式实时智能风控引擎。

安全可靠:荣获ISO20000、ISO27001 认证,遵循GDPR管理条例。

智能多元:覆盖多元化业务场景、支持多语言自动识别。

行业实践

向“音”而生 数美科技护航实时语音社交平台发展

目前数美的音频风控解决方案已服务多个企业,例如某语音社交APP每天产生上千万条的海量语音消息(包括群聊和私聊),这些语音消息都可能存在违规和广告导流等风险信息,全量审查语音消息的人工成本高、实时性差。采用数美智能语音识别服务后,需要审核的数据时长从每天860小时骤降到20小时,极大降低人工审核成本,识别准确率高达95%以上。

关于数美

数美科技(北京数美时代科技有限公司)成立于2015年6月,总部位于北京,并在杭州、上海、深圳、成都设有研发中心和分支机构, 团队核心成员均来自百度、阿里、腾讯、360、小米等知名互联网企业,拥有10余年搜索、安全、语音等互联网在线产品研发经验。目前,公司已累计完成四轮融资,累计金额超1亿美金。

数美科技是专业的在线业务风控解决方案提供商,致力于用AI技术解决在线业务中广泛存在风险挑战,为全球互联网、互联网+以及产业互联网客户提供全栈式、可信赖的在线业务风控解决方案,现已服务工商银行、银联、春秋航空、小红书、爱奇艺、猿辅导等上千家客户,覆盖金融、航旅、 游戏 、新零售、地产、电商、视频、 媒体 、出行、教育等十多个行业。

数美科技结合多年黑产对抗经验打造的全栈式智能风控产品-天网,旨在为客户解决 营销 欺诈、支付风控、数据盗爬、欺诈广告等风险问题,降本增效;同时,结合人工智能技术打造全栈式智能内容识别产品-天净,为客户提供一站式的内容风控方案,帮助客户识别文本、图片、音频、视频、网页中出现的涉政、违禁、暴恐、色情、导流广告等内容,规避内容风险,提升运营效率。

目前,数美科技已经构建了全场景、全流程、全维度业务风控产品矩阵,实现了SaaS AI风控网络的全球化部署,服务覆盖中国、东南亚、北美、欧洲、中东,累计拦截风险行为600多亿次,累计保护全球30多亿用户,为全球企业的线上业务发展保驾护航。

随意打赏

提交建议
微信扫一扫,分享给好友吧。