灵伴TTS2.0平台开放公测,助力更丰富语音交互场景搭建
从智能家居、自动驾驶到有声读物、虚拟主播,所有与人发生联系的地方,声音都成为了必要条件,语音交互更是成为诸多智能产品的标配。智能终端设备的大规模爆发,使得人与机器间的交互体验也被赋予更高期望——机器声音要自然流畅、接近真人,这对具备TTS能力的智能服务提供商来说也是一场来自市场的检验。
为了构建更丰富的人机交互场景生态,灵伴即时宣布面向全行业开放公测TTS2.0平台,这意味着各智能设备厂商、有声产品、语音交互产品等都将有机会通过API轻松将业界领先的语音合成能力对接至自身产品,让机器具备开口说话的能力。
灵伴TTS技术长期以来受到业内人士、客户等多方认可,属于业界顶尖水平:
国际语音合成大赛冠亚军
灵伴团队于2013年首次参加Blizzard Challenge国际语音合成大赛,便在自然度、相似度两方面以绝对优势拿下综合评测第一名的好成绩,被主办方评定为语音合成领域第三次里程碑式技术突破;时隔6年灵伴再次参赛,自研的语音合成模型与算法获得2019年度大赛亚军,语音合成成果的可懂度在赛事所有团队相似度、自然度前十的队伍中位列第一,占据绝对优势。
比拟真人的语音合成效果
在语音合成效果方面,灵伴独创的高自然度韵律模型和音色学习方法,使得合成的发音更加自然、韵律更加流畅;SSML的合成方式,可实现对发音、分词、停顿动态精准控制;这些都让机器最终的发音更加接近真人,在与人的交互中更易被接受、更受欢迎。
中英文混读能力
为满足不同语境下的复杂需求,灵伴TTS能够基于自研自动语料生成模型进行中英文混读,大幅提升数据采集效率,无需进行单独英文合成,即可实现同一音色中英文混说功能,韵律自然、流畅,使机器真实还原人类日常中英文混说场景。
多场景语音风格
灵伴TTS 2.0拥有全球最丰富中文合成音色库,包含男性、女性客服音色并分为甜美、气质、商务等多种风格;并有儿童、明星、小说、新闻播报等多领域特色音色;其中多个音色经由市场检验,已经应用于多个行业多个客服业务场景,完成了数以计亿次人机交互,并收获了用户的一致好评,此次开放后,企业或个人可按照自身需求选择调用。
再顶尖的技术只有落地为产品才是它的价值所在,从智能服务提供商角度来说,对实际业务场景需求的深刻理解力是将技术转化为产品的关键。此次开放公测的TTS 2.0平台很好的诠释了灵伴 “以用户为中心”的产品理念:
弹性计费,高效对接,海量需求,轻松满足
灵伴TTS2.0平台采取以客户成功为主的弹性计费方式,费用以实际播放时长计算,可以最大程度帮助用户省钱,合成播放时被打断,未播放的部分不计入费用;MRCP协议的方式,方便用户高效对接,一次开发,多种环境应用;平台中的云端语音合成引擎高效稳定,支持海量并发合成请求,满足用户业务高增长需求。
个性化声音IP打造
个性化定制也是灵伴TTS2.0平台为满足市场多样需求而开发的一项能力,先进的语音合成模型,仅需数小时语料即可在短周期内制作出优质、自然流畅、相似度高的音色,改变了传统语音合成定制需要十小时以上语料数据并且对录制环境要求极为严苛的方式,极大降低了用户定制个性化声音的门槛。
身为以人工智能技术为代表的新一轮新兴技术的践行者,灵伴一直怀揣着“技术普惠人类”的美好愿景,积极将新技术与产业实践相结合,并已为招商银行、中信银行、华夏保险、大地保险、北京大学、海尔 家电 、猎聘等数十个行业的头部客户带去了智能化升级体验,助力数百家企业实现工业4.0时代的产业重构。此次灵伴将自身优质的TTS能力开放给全行业,亦是希望将优质的语音合成能力赋予更多企业、更多产品、更多场景,助力搭建更美好的行业生态,让更多人体验到智能的未来。