搜狗发布语音交互引擎“知音” 支持实时纠错

DoNews-互联网 • 8年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

DoNews8月3日消息（记者费倩文）3日，搜狗语音交互引擎“知音”正式发布。据悉，搜狗的“知音”引擎具有识别速度更快、纠错能力更强、支持多轮对话等特点，使人机交互更加自然。

据搜狗语音交互技术中心负责人王砚峰介绍，搜狗语音交互引擎“知音”具有四大功能：一、基于端到端技术的语音识别能力；二、利用自然语言交互的语音纠错能力；三、基于知识图谱技术的行业知识整合能力；四、基于多轮对话技术的复杂语义理解能力。

在语音识别方面，“知音”引擎的语音识别速度提升3倍，错误率相对下降30%以上。搜狗CTO杨洪涛现场演示了搜狗语音交互引擎“知音””，一边发表演讲，现场的大屏幕一遍用文字显示出演讲内容，从现场可以看到，语音识别速度很快，识别程度很高，效果非常惊艳。

在语音纠错方面，据悉，搜狗的“知音”的语音纠错有3万多的词库，修改的准确率达到80%。实现了完全不依靠双手通过自然语音对文字进行修改，极大体现出语音的便利性。例如，用户可以说把“张”改为立早“章”。

此外，搜狗语音交互引擎“知音”支持多轮对话，比如用户说我要去首都机场，搜狗语音交互引擎“知音”会问是T1航站楼还是T2航站楼，当航站楼确定后，还问询问是出发还是接人。搜狗语音交互技术中心负责人王砚峰认为，多轮对话的人机交互技术更加自然，用户更容易理解和接受，从而提供更加人性化的服务。

搜狗方面的数据显示，搜狗搜索日均语音搜索次数增长超过4倍，搜狗手机输入法日均语音输入超过14亿次，目前是国内语音输入功能使用量最大的移动产品。搜狗方面还表示，在语音输入上的准确性上，与科大讯飞大致持平，但领先百度。

据了解，搜狗从2012年开始研发智能语音技术，并在2013年开始进行深度学习。目前，搜狗的智能语音技术已经成功应用至搜狗的全线产品中。

据悉，除了在搜索和输入法方面的应用，未来还将把智能语音交互应用到物联网、车联网和人工智能等各个方面，并尝试接入更多的终端。（完）