亚马逊推出全新Nova Sonic语音到语音模型可深入理解人类对话，捕捉语气、语调和节奏 | 速途网

速途网 • 2天前扫码分享

速途网4月9日讯（报道：乔志斌）今日，亚马逊宣布推出全新语音到语音模型——Amazon Nova Sonic。这款基础模型将语音理解和生成功能统一于单一的模型中，使AI应用程序中的语音对话更贴近人类的真实交流。通过简化语音应用开发流程，并提供深入理解人类对话微妙性的能力，Nova Sonic在客户服务通话自动化、旅游、教育、医疗和娱乐等领域展现出卓越的应用潜力。

在过去十余年间，亚马逊始终引领着语音技术的发展，从打造全球领先的个人AI助手Alexa到开发各类云服务如Lex、Polly和Connect等。然而，要让语音AI为客户创造更多实际价值，它必须能够理解人类对话的微妙与复杂性。传统语音应用开发需协调多个模型，包括语音转文字识别、语言理解和生成回复以及文本转语音，这种分散的方法难以保留自然对话中的声学情境和细微差别。

Amazon Nova Sonic采用全新方法应对这些挑战。该模型摒弃了使用多个不同模型的方式，而是将理解与生成功能统一于单一模型中。这使得Nova Sonic能够根据语气、风格等声学情境调整生成的语音响应，并理解人类对话中的自然停顿与犹豫。此外，它还能实时调取相关信息，提供更自然且实用的交互体验。

基于Amazon Nova Sonic构建的应用示例展示了其强大的功能，如在旅游AI代理中通过客户语气的变化来调整语调并实时查询价格信息，以及企业客户从基于公司数据生成响应的能力中受益。这些功能加上其超快的推理能力，使Nova Sonic支持的语音应用更加自然和实用。

亚马逊表示，推出Amazon Nova Sonic彰显了公司在先进基础模型领域的持续创新，并致力于为每一位客户提供实际价值。