搜狗发布语音交互引擎“知音” 支持实时纠错
DoNews8月3日消息 (记者 费倩文)3日,搜狗语音交互引擎“知音”正式发布。据悉,搜狗的“知音”引擎具有识别速度更快、纠错能力更强、支持多轮对话等特点,使人机交互更加自然。
据搜狗语音交互技术中心负责人王砚峰介绍,搜狗语音交互引擎“知音”具有四大功能:一、基于端到端技术的语音识别能力;二、利用自然语言交互的语音纠错能力;三、基于知识图谱技术的行业知识整合能力;四、基于多轮对话技术的复杂语义理解能力。
在语音识别方面,“知音”引擎的语音识别速度提升3倍,错误率相对下降30%以上。搜狗CTO杨洪涛现场演示了搜狗语音交互引擎“知音””,一边发表演讲,现场的大屏幕一遍用文字显示出演讲内容,从现场可以看到,语音识别速度很快,识别程度很高,效果非常惊艳。
在语音纠错方面,据悉,搜狗的“知音”的语音纠错有3万多的词库,修改的准确率达到80%。实现了完全不依靠双手通过自然语音对文字进行修改,极大体现出语音的便利性。例如,用户可以说把“张”改为立早“章”。
此外,搜狗语音交互引擎“知音”支持多轮对话,比如用户说我要去首都机场,搜狗语音交互引擎“知音”会问是T1航站楼还是T2航站楼,当航站楼确定后,还问询问是出发还是接人。搜狗语音交互技术中心负责人王砚峰认为,多轮对话的人机交互技术更加自然,用户更容易理解和接受,从而提供更加人性化的服务。
搜狗方面的数据显示,搜狗搜索日均语音搜索次数增长超过4倍,搜狗手机输入法日均语音输入超过14亿次,目前是国内语音输入功能使用量最大的移动产品。搜狗方面还表示,在语音输入上的准确性上,与科大讯飞大致持平,但领先百度。
据了解,搜狗从2012年开始研发智能语音技术,并在2013年开始进行深度学习。目前,搜狗的智能语音技术已经成功应用至搜狗的全线产品中。
据悉,除了在搜索和输入法方面的应用,未来还将把智能语音交互应用到物联网、车联网和人工智能等各个方面,并尝试接入更多的终端。(完)