离在线语音识别彰显AI实力,百度输入法引领行业语音输入发展
语音输入一定需要网络支持吗?随着百度输入法离线语音输入能力的发展,这个问题有了全然不同的答案,如今语音输入受制于网络环境,一断网就“罢工”的老大难已经得到解决。
早在今年一月,百度输入法AI探索版正式问世,发布会现场就测试了包含百度输入法在内三款不同输入法产品的“离线语音识别能力”。经过对输入法上嵌入式识别的Deep Peak2模型进行优化,百度输入法大幅提升了离线语音识别准确率。在同款 手机 、相同的网络环境中,测试者对三款输入法说出用同样的语句,只有百度输入法做到了在没有网络情况下无错字、无漏字的“零失误”,其他两款输入法均出现一些错字或者遗漏现象。
(图:手机输入法离线语音测评)
在准确性领先的同时,百度输入法的离线语音还做到了逐字流式上屏,即用户说到哪个字,哪个字就可以实时上屏、逐字输出,超越了其他输入法滞后上屏或者一句话说完仍需等待才能上屏显示结果的情况,语音输入体验最为流畅。此外,百度输入法的安卓版离线语音包仅有35MB,远小于其他输入法,在不占用户手机内存的情况下,仍能实现高质量的语音输入。
更为重要的是,百度输入法的语音输入可支持离在线智能切换,是唯一一家真正做到用户无感知自动切换的输入法。这意味着,只要用户下载了离线语音包,在进入电梯地铁等无网或弱网环境时,输入法会就会自动为用户切换识别模式,而用户对此不会感到一丝卡顿和滞后,真正做到语音“自由说”和“随时说”。
(百度输入法离线语音)
百度输入法不仅拥有高水准的离线语音识别能力,在线语音识别方面也进步不断。百度输入法业内首创的流式截断的多层注意力建模(SMLTA),将在线语音识别精度提升了15%,超越行业最高水平15%,并在世界范围内首次实现了基于Attention技术的在线语音识别服务大规模上线应用。这一技术实现了中文在线语音识别的两大突破:世界上首次实现了局部注意力建模识别精度超过全局注意力模型、世界上第一次大规模部署在线语音交互注意力模型。SMLTA技术在离线语音识别上的应用,将百度输入法离线语音的识别精准度提升到了与在线语音同样精准水平,准确率超过98%。
今年9月,全球知名的新 经济 产业第三方数据挖掘和分析机构艾媒咨询(iiMedia Research)发布《2019上半年中国第三方手机输入法专题研究报告》,显示2019上半年中国手机输入法用户语音输入的使用渗透率已超过57.4%,整体语音输入用户规模已超4亿。其中,百度输入法语音输入用户规模达2.71亿,语音日请求量峰值突破6.2亿次,成为日人均语音输入次数最多,国内最强的语音输入法。高效便捷的语音输入功能已受到越来越多的用户欢迎,而百度输入法不断取得突破的离在线语音识别能力,更是为线上沟通扫清了障碍,让用户能够在更多场景下“畅快发声”,感受极致的语音输入体验。