搜狗发布“知音”语音引擎,让语音助手会纠错、会沟通

爱范儿  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

心急如焚的你要赶往机场,语音助手却偏和你唱反调。你降低语速,反复说了几遍,它才明白你要去哪,最终却导向了错误的航站楼。 语音助手 “不智能”、没帮助的痛点,即是搜狗“知音”想要解决的。

今日,搜狗发布了新的智能语音引擎“知音”,宣称要把搜狗语音助手打造的更加智能,达到 “能理解会思考” 的程度。对此,CTO 杨洪涛和语音负责人王砚峰登台进行详细介绍。

搜狗发布“知音”语音引擎,让语音助手会纠错、会沟通

“知音”想解决的第一个痛点是 语速过快导致的吞音问题。 当你讲话过快时,很多语音助手会因为音节的模糊而发生识别错误。而搜狗称,“知音”的识别速度与前代相比可以提升 3 倍,而错误率则可以下降约 30%。

在发布会上,搜狗全程使用了它们的 实时转写技术 。二位主讲全程都没有故意放慢语速,而“知音”实时投放在大屏幕上的字幕,则保持着还算不错的准确度。当然,用词错误的情况还是无法避免的。

搜狗发布“知音”语音引擎,让语音助手会纠错、会沟通

此外,“知音”想解决的第二个痛点是 纠错问题 。我们通常用语音输入文字,由于识别不清,免不了要换回键盘继续再修改错别字。搜狗为了让语音识别彻底摆脱键盘,允许你通过语音进行修改。

比如,根据王砚峰的介绍,你可以直接告诉语音助手:把弓长“张”换成立早“章”,或者,把山峰的“峰”换成烽火的“烽”,语音助手就会自动为你修改。

搜狗称,能实现这一点,与现有业务的数据储备是分不开的。搜狗输入法的词库、拆字库、用户的语料库,以及百科知识图谱,都为“知音”的识别能力提供了数据支撑。

搜狗发布“知音”语音引擎,让语音助手会纠错、会沟通

而“知音”想要解决的第三个痛点则是 对用户真实意图的识别。 为此,他们为“知音”加入了一个多轮对话的功能。

根据搜狗在现场的演示视频,当你告诉“知音”你的目的地是首都国际机场时,知音不会马上为你规划路线,而是会 进行对话 。它会询问你要去的航站楼、航班号,问你直接去航站楼,还是停车场,一切确定之后才会生成导航路径。

这种场景会话能力与 Google 今年在 I/O 上介绍的 新语音助手功能 类似,会结合你之前问过的问题提供信息,而不是让这个过程变成机械的一问一答。

王砚峰称, 机器的语义理解在 5 年内将不会有太大突破 ,当前的技术水平不足以支撑问题难度,因此机器想具有人的理解能力还有很大距离。

深谙这个道理的搜狗,选择搁置技术瓶颈,利用现有服务的数据,结合用户各种使用场景,希望让语音助手达到真正对用户有帮助,而不是制造更多麻烦。杨洪涛认为,只有真正考虑用户的使用场景,才能帮助语音平台积累数据,最终达到数据反哺机器学习技术的效果。

目前,iOS 版搜狗语音助手已经上线了语音纠错功能, Android 版稍后会迎来更新。

题图来自: myappwiz

随意打赏

搜狗语音助手搜狗搜索引擎搜狗引擎搜索搜狗引擎
提交建议
微信扫一扫,分享给好友吧。