好声音上线|标贝科技多情感音色 让人机交互更深入人心
一直以来,“声音”作为大脑中最基础的记忆类型,为情感内容创造发挥重要作用。对于智能语音产品而言,声音的表现力尤为重要。在人工智能飞速发展的今天,智能语音已经无处不在,通过富含多种情感的语音呈现,为我们的生活增添更多欢乐和色彩。
人机交互 越来越需要“感情”
从早期的机械化语音合成发展至今,在深度学习的推动下,语音合成的自然度和音质都得到了极大的提升。应用领域也从相对简单、单一的场景,升级到更复杂、综合的场景,对合成声音的辨识度、情感表现力、节奏感等要求越来越高。事实上,不同场景和文本类型,对声音的要求也不同。在日常语言对话中,我们通常会用一些明显的情感信号来强化声音的效果。例如,开心、愤怒、疑惑、惊惧等不同情绪下说同一句话,但听起来的感觉是截然不同的。随着人们对完全沉浸式视听体验追求的不断增加,情感音色的重要性只增不减。人机交互过程中,人们越来越需要机器给予“感情”回馈,让彼此的交流更有真实感。
情感合成 赋予AI语音“人情味”
如果说语音合成技术为机器人装上了嘴巴,而情感合成则丰富了机器的情感表达。让机器具有“人情味”,能“哭”会“笑”,满足不同情境下的不同语意表达,为人机交互赋予情感温度。例如,在智能客服场景,面对顾客投诉反馈意见时,智能客服需要用抱歉的情感音色来表达对顾客的歉意;在有声阅读中,不同角色、不同感情特征的声音,更能推动故事情节的转承起伏;在虚拟主场景里,一个热情、有感染力的专属IP声音,更能调动观众的主动性。因此,如何让合成语音具备人声的情感表现力,成为语音合成重要发展方向。
标贝 科技 多风格多情感合成音色
标贝科技深耕AI语音交互领域多年,致力于语音交互技术的创新研发和 商业 化应用,推出包括普通声音复刻、精品声音复刻、TTS标准化定制等多种个性化音色定制解决方案。
对于语音合成的情感表现场景,标贝科技依托于成熟的深度学习技术,充分利用多风格情感语音大语料单独预训练技术,实现了风格拓展、情感控制等方面的重要突破,重新定义和升级了情感合成方案,实现了更加接近真人情感化表达的声音效果。
近日,标贝科技再上新7个多情感发音人,包括3个男声、3个女声以及1个童声音色。支持开心、生气、可爱、安慰、中性等多种风格多种情感表达,适用于虚拟数字人、有声读物、纪录片、直播、 游戏 解说等场景需求。
标贝科技多情感音色特点
▍多情绪多风格
标贝情感音色提供真实自然的开心、悲伤、惊讶、恐惧、厌恶、中性等多种情绪以及闲聊对话、客服、新闻等多种风格音色,以声传情,适用于不同情境下的不同语意表达。
▍音色效果真实饱满
标贝情感音色基于成熟的深度神经网络技术及新一代高音质合成系统生成,合成效果更接近真人的韵律、情感,真实流畅,可实现高度拟人化的情感表达。
▍场景音色定制化
支持情感强弱、语速、音量等关键声音属性调节,用户可以根据场景的情感连续性,进行更加契合的语速和语气调整,随心创造专属的情感音色。
目前,标贝科技多情感风格音色已经在标贝官网、标贝开放平台同步上线。据悉,近期标贝还将上新更多的情感音色,欢迎各应用厂商、及企业开发者体验接入。