从手控到声控,智能家居的语音交互技术需“量身定做”
2011年,苹果在iPhone 4S上首次内置了Siri,此后的几年间,几乎所有的手机都开始内置语音助手类的应用。当下比较为大家所知的国际上有Google Now、微软小娜(准确的说,是“个人智能助理”Cortana),国内公认语音搜索技术较为成熟的科大讯飞、以及百度、搜狐等公司都推出了语音助手类应用。而今年以来,在各大科技巨头纷纷布局智能家庭领域之时,语音交互技术再次成为他们抢占入口的筹码。
设想一下,在人工智能时代,智能入口将会是什么样子?或者说决定智能家庭入口的关键因素是什么?
“在智能家居行业这个万亿级的市场机会中,自然人机接口和人工智能是关键的通用技术。” 科大讯飞董事长刘庆峰在接受钛媒体采访时说道。尤其在场景化的环境下,如遇到不方便手或眼操作的情况,语音将是首选方式。
确实,语音作为人类沟通和信息获取最自然、最便捷的交互技术,使得人与机器之间的交互能够像人与人之间交流,对提升人机交互的友好性和信息系统的应用普及有着举足轻重的作用。
问题是,既然智能家居市场的语音交互有着巨大的潜力,为什么一直没能迅速火起来甚至普及?根据钛媒体的观察,原因主要有三点:
1、没有建立统一的行业标准,硬件适配很复杂,导致硬件厂商不敢贸然投入大规模的研发,现阶段仍处于试水期。
2、教育用户市场问题:用户对语音的使用习惯需要一个培育过程,目前智能家居产品仍然是小众人群才接触的到,智能家居的理念需要时间推广和普及。
3、语音操控对网络依赖性较大,而智能家居的控制多是基于WiFi网络的,如果网络不稳定或者断掉,智能家居的语音交互马上就变成了完全失灵的状态。
针对这三个问题,科大讯飞董事长刘庆峰并没有显示出过多的担心,并且还向钛媒体透露,“工信部已表态,将在今年第四季度制定相应的行业标准,来推动智能家居市场的发展”,这意味着,智能家居行业发展过程中的最大绊脚石将被推开。
但是如今的语音助手类应用存在着功能的同质化、语音识别准确率低,尤其在复杂的环境条件下体验不佳的问题,这也是科大讯飞的技术团队一直在着力解决的一个技术难点。
近期,科大讯飞对其灵犀语音产品助手进行了升级,推出了最新的语音助手“灵犀3.0”。据悉,3.0版本基本能够应对嘈杂环境糟糕的语音环境以及麦克风带来的干扰,而且语音助手灵犀3.0与硬件厂商进行了深度合作,包括对电视、电视、电灯、空调、热水器等家电的语音操控。
此外,新版本另一个最大亮点是实现了“预设任务”功能。比如,你可以预设好回家时需要空调打开调为26摄氏度并关上窗帘,当你远程对着手机说“我要回家了”的时候,你预设好的这些任务就可以全部执行,这虽然只是把文字任务转变为语音任务,还是会更智能家居带来更多智能的感觉。
据刘庆峰介绍,目前主流的电视厂商和科大讯飞基本都有合作,包括TCL、长虹、海尔、海信、康佳、创维等,有的是个别品牌,有的则是全线产品。科大讯飞进入智能家居领域是要推动“从手控到声控”的变革。从中也不难看出,科大讯飞以智能语音技术切入智能家庭市场的决心。
不过,在实际测试中钛媒体编辑发现,灵犀语音助手3.0对语义的识别并不是很理想,如果灵犀没能正确识别,还会提示你可以如何如何来下命令,这就给交互造成了较大的局限。也就是说,单独的语音识别在设备中的应用依然不够“听话”。
不过至少,科大讯飞做出了可以让用户“摆脱手机”的语音交互方式。
用语音实现对智能家居的操控,听起来很高大上,不过这样的交互场景,距离我们依然很远。根据钛媒编辑的调查,绝大部分人利用语音助手只是简单的聊天和打发时间,而不是用来完成任务。加上目前智能家居中的语音交互还比较依赖于手机。也就是说未来智能语音技术的发展,必须同时解决自然语言交互和完成有用任务的问题。如果某一天可以让机器像人脑一样做到学习和思考,进而实现机器从“能听会说”到能理解会思考的跨越,智能家居的语音交互时代也就真的来了。(本文首发钛媒体)
(关注更多钛媒体作者观点,参与钛媒体微信互动(微信搜索“钛媒体”或“taimeiti”))