亚马逊推出全新Nova Sonic语音到语音模型可深入理解人类对话,捕捉语气、语调和节奏 | 速途网

速途网  •  扫码分享

速途网4月9日讯(报道:乔志斌)今日,亚马逊宣布推出全新语音到语音模型——Amazon Nova Sonic。这款基础模型将语音理解和生成功能统一于单一的模型中,使AI应用程序中的语音对话更贴近人类的真实交流。通过简化语音应用开发流程,并提供深入理解人类对话微妙性的能力,Nova Sonic在客户服务通话自动化、旅游教育、医疗和娱乐等领域展现出卓越的应用潜力。

在过去十余年间,亚马逊始终引领着语音技术的发展,从打造全球领先的个人AI助手Alexa到开发各类云服务如Lex、Polly和Connect等。然而,要让语音AI为客户创造更多实际价值,它必须能够理解人类对话的微妙与复杂性。传统语音应用开发需协调多个模型,包括语音转文字识别、语言理解和生成回复以及文本转语音,这种分散的方法难以保留自然对话中的声学情境和细微差别。

Amazon Nova Sonic采用全新方法应对这些挑战。该模型摒弃了使用多个不同模型的方式,而是将理解与生成功能统一于单一模型中。这使得Nova Sonic能够根据语气、风格等声学情境调整生成的语音响应,并理解人类对话中的自然停顿与犹豫。此外,它还能实时调取相关信息,提供更自然且实用的交互体验。

基于Amazon Nova Sonic构建的应用示例展示了其强大的功能,如在旅游AI代理中通过客户语气的变化来调整语调并实时查询价格信息,以及企业客户从基于公司数据生成响应的能力中受益。这些功能加上其超快的推理能力,使Nova Sonic支持的语音应用更加自然和实用。

亚马逊表示,推出Amazon Nova Sonic彰显了公司在先进基础模型领域的持续创新,并致力于为每一位客户提供实际价值。

随意打赏

提交建议
微信扫一扫,分享给好友吧。