【人工智能沙龙】未来,语音识别可能应用于哪些商业化场景?
近日, Companies and Markets 的评估报告称,未来全球语音识别市场将会变得更加多样化,同时软件准确度上会有大幅提升。预计在2017年以前,这一块的市场将达到1330亿美元。看过电影《Her》的朋友一定会对其中语音识别和控制的情节印象深刻,我们此前 详细介绍 过这项技术实现的难点,但在看得到的未来,语音识别技术究竟应用于哪些场景呢?
提起语音识别,我们最容易想到的可能是不会讲笑话的Siri。Siri的技术来自 Nuance ,世界上第一家上市的语音识别公司。几个星期前 有传闻说 百度欲收购Nuance助力自己的语音助手应用,但此事已被百度深度学习实验室(IDL)主任余凯否认。去年11月也曾传出三星曾与Nuance商谈收购事宜,却被其连续亏损六个月的状况吓退的新闻。另一方面,苹果并不想一直依赖Nuance的技术,进行了一系列 自组队活动 ,这也促使Nuance寻找新的出口。
语音识别作为一项很难直接带来现金流的业务,让Nuance操碎了心。公司整体状况虽然不容乐观,但我们依然看得到Nuance一直以来在不同领域商业化上的尝试。
医疗领域
前一段时间,Nuance在其 官方博客 上,公布了将发力医疗领域的消息。不仅是简单的通过智能手表追踪运动情况和心率,还有直接根据人的身体状况匹配相应的服务如合适的餐厅或食物等,当然这些大多是基于可穿戴设备的。另外他们还考虑到更多场景,诸如紧急语音求助,医患对话存档,呼叫中心的对话听写等。
由于医疗领域词汇库专业性强演变性弱,只要建立完整的数据库,就可以做到对疾病名称、药品名称相对精确的识别。国内已有的应用如 病历夹 与 珍立拍 ,为医生提供一个安全存储病历资料的云空间,方便查找病例,支持语音搜索功能。
智能车载
行车安全问题上一直聚焦了很多目光,去年有人曾经设计出一个 车载屏幕 ,可以利用多指的简单手势解决司机操作触摸屏过度分散注意力的问题。事实上,Nuance早已有定制的汽车级语音平台 Dragon Drive ,并获得了2015CES创新大奖。通过将车载平台与手机连接,Nuance可以帮用户实现语音控制GPS导航,信息收发,电话接打,社交网络更新等等。
智能可穿戴
北京的冬天越来越冷,有无数次需要用手机却死活不想伸手。打电话,发微信,查路线,叫车,这些如果都可以用一个可穿戴设备通过语音控制实现,那该多好啊。目前出门问问团队以做出搭载Moto 360的智能手表操作系统 Ticwear ,可以实现直接语音控制滴滴打车。
早在一年前,Intel就 开发出 可穿戴设备原型Jarvis,可戴在耳朵上之后连入手机,以此实现听懂主人发出的指令、给予语音反馈的功能,充当类似Siri的个人语音助手角色。这不就是《Her》里面的场景么!
智能家居
之前我们介绍了一款叫Luna的 智能床罩 ,想要以一种全新的方式收集更多人体数据,同时整合各种智能家居。语音识别或许是最适合成为整合入口的方式,尤其当我们躺在床上完全不想看任何屏幕的时候。何况,Nuance早就研发出可以语音控制 电视 、 手机 的技术。
36氪 作者 大飛哥 曾发朋友圈说,“ 谁能用互联网思维改造一下家庭浴室,每次进去都要揣个扬声器很麻烦的,况且切首歌,接个临时电话简直是反人类 。”智能家庭浴室虽然还没有听说,不过可以通过语音操控的智能音箱已经有了,如我们介绍过的 小智超级音箱 。
教育领域
之前我们提过语音识别的难点之一是众多语言和方言的差异化。这一点反过来看,可以成为其在教育领域的应用。让数据库提供一个标准,可以为口语评测提供一种更加简便高效的方式。
在辅助学习方面,我想起一年前的 36氪 开放日上海站 ,“ 紫冬口译 ”这款基于云识别的中英文同声翻译应用。它集成了语音翻译、语音识别和语音合成技术。你只需对着手机说出想要翻译的句子,即可得到中英文双重语音播读结果和可视的文本结果。它支持连续的语音输入,甚至可以根据你的语气自动为你添加标点符号。
总而言之,说话是人类最自然的交流方式,我们可以说 人工智能是伪智能 ,机器永远不会像人一样去活着,但机器可以变得越来越善解人意。
[ 36氪 原创文章,作者: 糖醋]