标贝科技直播带货场景合成数据库 助力打造优质“AI主播”
“嗨,欢迎宝宝来到直播间,点击关注不迷路,每晚都有直播福利哦~”
“618福利来了,直播间的粉丝宝宝们,12点整的时刻我们就最先抽免单了啊~”
当你走进直播间,看到“虚拟主播”跟你打招呼时,千万不要惊讶。现在各大平台已经有越来越多的虚拟人坐镇直播间,这也是今年618平台正在重推的直播带货赛道“新亮点”。
事实上,如果不仔细观察,你很难发现这些主播是AI虚拟主播。她们不仅外形与真人相似,在声音、情感和动作方面也表现得非常逼真,有些甚至还具备跳舞、唱歌等才艺。
AI赋能数字人 打破直播带货次元壁
从以“一禅小和尚”、“我是不白吃”、“默默酱”等为代表的虚拟IP初探直播带货开始,AI数字人直播正逐渐改变传统的零售业和电商行业。越来越多知名品牌已经开始尝试利用AI虚拟人直播来推广自己的产品,例如完美日记的“Stella”,自然堂的“堂小美”,花西子的“花小西”等虚拟主播。
相对于真人主播高昂的运营成本,虚拟主播不受时间、地点、环境限制,一键开播,24小时全天候在线的优势,极大的降低了商家直播带货的成本。对于平台而言,虚拟主播是电商平台生态布局中不可忽略的一环,通过不断降低直播门槛,增加平台对中小商家的吸引力。
高质量合成数据集 打造“能说会道”的优质主播
AI数字人直播带货,已然是大势所趋。不过,要实现广泛 商业 化落地也面临着不小挑战。尤其是高配版的虚拟人,效果越逼真,成本也会水涨船高。
直播间里,主播主要通过声音和画面两种途径来介绍产品信息。其中声音是不可忽视的“第一媒介”。首先,主播有一个自然流畅、情感丰富的音色,才能给用户带来舒适的听感,反之,如果主播的声音过于机械、冷漠,则会影响观看欲望;其次是互动体验,例如主播通过语音控制发红包,粉丝通过语音连麦与主播沟通,都会增加与直播间用户的粘性。
因此,为了达到更好的直播效果和用户体验,商家需要对虚拟主播的语音交互能力不断进行调试,打磨直播话术,完善与用户互动的功能。
从技术层面来看,基于机器学习的各种能力,都离不开算法和数据的积累。想要提高直播带货场景下的语音交互能力,就需要大量的优质直播场景数据作为模型训练支撑。
标贝 科技 深耕AI数据服务领域多年,在数据采集和标注方面具备丰富的实践经验。 针对直播带货场景,标贝科技基于专业级录音棚及优质声优资源,精心建立了高质量语音合成数据库,并完成对数据库的音字标注、韵律标注、音素边界标注、口语化标签标注等,可供算法优化直接使用,确保合成出来的音色更稳定、自然度更高 。
基于直播带货场景的合成数据库
语种: 中文普通话、中英混合
采集环境: 专业录音棚,信噪比不低于35dB
数据时长: 5小时中文,1小时中英混
录音语料: 主播直播带货话术
采样格式: 无压缩PCM WAV格式
采样率: 48KHz 24bit
标注内容: 音字标注、韵律标注、音素边界标注,重音、拖音、笑声等标签标注
适用领域: 直播带货
欢迎对以上数据集感兴趣的行业伙伴联系我们~
如果以上数据不能满足您当前的需求,标贝科技还可以针对特定人群、特定场景、特定语种提供相应的数据定制化服务,全力帮助企业客户得到满意的数据服务。