语音识别领域新突破:进食中也可精准识别

创见网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

近年来,语音识别技术已得到广泛应用,但其识别准确性依旧有待提升。抛开各种口音与方言干扰,考虑到用户可能在各种极端情况下讲话,如何辨认非标准发音已成为业内亟需解决的问题。

日前,科技公司 Voxil 公布了其最新研究成果——一款复杂的语音识别程序,Voxil 称其为「自然语言识别领域的重大突破」。

Voxil CEO Caleb Roush 在接受洋葱新闻采访时称,「我们最新的语音识别软件专为吃货用户服务,即使用户正在咀嚼或口中塞满食物,也能精确识别用户所说的内容。毫无疑问,这款软件将帮助 Siri 等语音助手极大提升用户体验。」

Roush 表示,软件算法较为复杂,也正因为如此,它可以精准过滤外界噪音,例如咀嚼声、牙齿摩擦声、松脆的食物在口中被压碎的声音、双唇和舌头运动的声音等,并从中分辨出用户含混不清的说话声,其识别准确度可达到惊人的 99%。

Voxil 公司甚至提出了一个名为 GAR 的新概念(译者注:GPS-aided recognition,位置辅助识别),称为提升识别精度,软件自带 GPS 功能,可精准定位用户坐标并判定其所在餐厅类别,从而结合大数据,根据可能提供的食物种类对识别内容做出相应调整。

洋葱日报记者对「真正的吃货在享受美食时并不愿讲话」 这一角度提出了疑问,但 Voxil 公司并未给出正面回答。Roush 仅表示公司已着手研究如何在用户吃太多无法讲话的情况下通过脑电感应识别用户意图,并透露相关智能硬件将在不久后面向公众发布。

文章来源: 洋葱新闻 ,本文由TECH2IPO/创见编辑后发布。

标签: 语音识别 Siri Cortana

随意打赏

提交建议
微信扫一扫,分享给好友吧。