腾讯优图开放语音合成技术 多场景应用人机互动升级

砍柴网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

语音合成是人工智能领域用语音实现人与机器交互的关键技术。近日,腾讯优图实验室在优图开放平台上正式对外开放了语音合成API。这种语音合成技术能够实现更亲近更自然流畅的人机交互,同时也在有声读物、教育教学、智能玩具、智能家居等场景实现应用,让人工智能连接未来的目标愈发清晰。

自然流畅可定制优图开放语音合成技术

语音合成(Text to Speech,TTS)技术是指将文本文字变成语音并朗读出来的技术。为了让机器开口说话,与人类更进一步交流,语音合成的自然度、多语种能力、快速定制能力也就十分重要。

据了解,为了提高语音合成的自然流畅度,优图的语音合成技术在声学、韵律上采用了深度模型,这使得合成的语音发音自然、清晰、韵律感流畅,接近业界顶尖水平。同时,这也让机器与人的互动显得更亲近。

面对更复杂多变的现实人机交互应用需求,单一语种的语音合成显然已经不足以应对。优图语音合成技术能够实现中文、英文、中英混读。此外,优图通过使用迁移学习技术还实现了跨语言合成,即中文语料可以合成英文,反之亦可。

而随着时代的发展,人们对智能语音技术有了更高的要求,比如让合成语音听起来更像某个特定发音人。目前,依托优图语音合成的深度模型,可根据用户需求实现音库定制,满足用户的个性化应用。

做主播、陪孩子玩耍语音合成实现多生活场景应用

技术的提升使得语音合成技术在人们的生活中得到了更广泛的应用,优图的语音合合成技术就在有声读物、教育教学、智能玩具、智能家居等领域实现了应用落地。

企鹅FM中的虚拟主播Q小播就是一个例子。在对外开放语音合成能力之前,优图已为腾讯内部产品企鹅FM提供了技术支持,使用了优图语音合成技术的Q小播,用亲近感十足的声音为读者播报新闻实时听等专题。

语音合成技术的应用在这个时代还有更深远的社会意义。通过拥有语音合成技术的智能玩具,可以在父母因忙碌工作而无法陪伴孩子时,陪孩子说话、给孩子讲故事、教识字等,消除孩子的孤独感。优图的语音合成技术已为腾讯云小微智能语音系统提供技术支持,并应用于小Q机器人第二代。

此外,优图的语音合成技术还可以帮助特殊人群,例如对于丧失说话能力的群体,可以将需要表达的文字输入到语音合成技术的体验平台或应用中,便可将文字生成语音来传递信息。而在智能家居应用中,语音合成技术也是必不可少的。可以预见的是,在未来,语音合成技术将在更多场景融入寻常生活,如此的人机交互升级将使得人工智能对于人类更有意义,并让人们的生活更加美好。

随意打赏

腾讯应用开放平台腾讯优图人脸识别腾讯优图实验室腾讯开放平台腾讯优图
提交建议
微信扫一扫,分享给好友吧。