谷歌语音识别技术差错率降至4.9% 归功神经网络技术
腾讯科技讯 据外媒报道, 谷歌 ( 微博 )CEO桑达尔-皮查伊(Sundar Pichai)刚刚在2017年谷歌I/O大会上宣称,该公司的语音识别技术现在的差错率已降低到了4.9%。
相对于以往来说,这是一个非常大的进步。在2013年,它的差错率为23%;在2015年的I/O大会上,谷歌宣称其语音识别技术的差错率为8%。
谷歌利用深度学习技术来实现准确的图像识别和语音识别。这种方法包括用大量数据来训练名为“神经网络”的系统,然后给该系统提供新的数据,让它进行预测。
“我们在很多产品中都采用了语音输入方式。”皮查伊说,“这是因为电脑越来越善于识别语音了。从去年以来,我们在这方面取得的进步非常惊人。我们在嘈杂环境中的语音识别技术正在不断完善。因此,当你用手机或智能家居设备Google Home对谷歌讲话时,我们就能够正确地识别你的声音。”
相对而言, 微软 在2016年10月宣称,它已取得了可与人类媲美的语音识别水平。它的差错率当时为6.3%。但是,我们并不清楚这两家公司是否采用了相同的衡量标准。
事实上,谷歌吹嘘其语音识别技术的进步已有一段时间。今年初,该公司就宣称,它的语音识别差错率从2012年以来已减少了30%。这种技术进步的主要原因是什么呢?谷歌证实这是因为它使用神经网络技术的缘故。
皮查伊还分享了开发Google Home的逸闻趣事,“当我们开发Google Home的时候,我们原计划使用8个麦克风。但是,由于采用了基于神经波束赋形技术的神经网络系统,我们最后只需要用两个麦克风就达到了相同的效果。”(编译/乐学)