Moto X的语音全程待命唤醒功能是如何实现的?|Moto X 语音识别 智能语音
今年8月,Moto X正式亮相。其永远处于激活状态的语音识别功能惊艳四座,随时随地都可以用语音“OK Google Now”来控制而不必打开手机再发出语音命令比其他语音助手产品提前了不是一步。
Moto X即使是处于待机锁屏状态,也可以接受你的任何语音指令,通过语音指令激活。
有程序员猜测,Moto X(我猜测Google Glass也类似)的这样实时唤醒是很可行的。
从语音识别的原理来看,现在的语音识别,是一个声音信号->音素->词->句的多层转化过程,需要耗费巨大的资源来存储以及搜索各种声音模型、语言模型等等,所以完全的自然语音识别很难做到手机本地,一般都在云端。
但如果只是识别一些特定的语句,比如用于唤醒的语句 “OK Glass”, “Hello Moto”,这只需要在内存中载入很少的模型,就可以达到高精度识别目的。一旦识别了唤醒语句,再开启网络模块收集之后的用户说的话,再发送到Google服务器做进一步的识别。这样可以在保持低能耗的情况下做到随时响应
题外话,在语音识别上本来就有类似的多级缓存搜索策略,声音先会第一遍经过简单的语音识别模型(lattice),搜索出个大概,然后再进行第二遍在更高级模型上的re-evaluation。
如果让我来实现这样的系统的话,我估计会按照这个思路来做。Google具体怎么实现的我确实不太清楚,但大致方向应该是类似。
我特别赞同这功能,我觉得这才是语音识别应该有的样子!Google官方真来做这个(@鄭紫陽 提到了iOS7也有!),那是再好不过了,体验应该非第三方应用可比,这是用户之福。