智能家居语音控制技术应用现状分析
在智能家居给人们带来便捷生活的同时,人们的控制习惯逐渐发生改变。语音技术的发展也为控制入口做了一个补充,在抛去了传统遥控器和手机APP之后,通过口令发送让家居环境达到舒适状态,让生活更便捷智能,这是否会成为智能家居行业下一个阶段的普遍应用?
远场语音识别、云端语义辨识、人工智能应用等等一个个技术节点得到新的突破,为智能家居提供了新的控制入口选择。本文将从技术趋势多角度为您呈现语音控制技术在 智能家居产品 和集成项目中的应用前景。
科大讯飞:将语音控制落地化成果应用于智能家居行业
科大讯飞是国际上最早开始研究远场语音识别技术的机构之一,也是国内唯一具备成熟解决方案的厂商之一。目前在智能语音和人工智能领域的落地化研究成果包括:“讯飞超脑”计划正在研究的“自主互联”、 “自然交互”及“智能决策”; 多语种、多类别的高效语音识别;业界最高响应率的低功耗语音唤醒;“声纹+人脸”识别:为智能家居相关使用场景提供安全可靠、自然流畅的验证方式;远场语音识别;语音合成;智能家居语义库:智能家居行业全类别的控制指令,拥有平均使用场景下超过94.43%的准确率;软件硬件一体的解决方案;技术+服务的深度对接支持等,讯飞目前的技术能力将智能语音和人工智能领域的落地化研究成果应用于智能家居行业,并且提供一站式打包方案。
麦克风阵列基本原理图
远场语音:多麦克风灵活排列 拾音波束抑制噪声
在远场场景中,空间的混响、背景噪声、人声干扰以及音源的回声都会急剧的降低语音识别的体验。科大讯飞的“远场识别”技术采取多麦克风灵活排列的方式,通过线性阵列、平面阵列、立体阵列能对声源的距离、方向作出判断,适应各种远距离应用场合,保证准确稳定的识别效果;同时根据麦克风阵列的空域滤波特性,在目标说话人方向形成拾音波束,抑制波束之外的噪声和反射声,以使得其具备良好的降噪和去混响效果。这是科大讯飞的“远场识别”技术不同于业内其他被称为“远程/远距识别”技术的关键所在。
讯飞超脑:突破感知向理解目标迈进
“讯飞超脑”计划是科大讯飞启动的针对高级人工智能,即认知智能的前瞻重大攻关项目,是讯飞从“让计算机能听会说”成功的基础上,向“让计算机能理解会思考”的目标迈进的关键项目支撑。在语音识别等传统人工智能,即感知智能领域取得了突破基础上,科大讯飞于2014年年中正式启动了讯飞超脑计划,该计划的目标是研发实现具有深层语言理解、全面知识表示、逻辑推理联想、自主学习进化等高级人工智能的智能系统,并且在教育、客服、人机交互、医疗等领域实现推广应用,推动相关应用系统实现智能程度的本质突破。
单麦克风、麦克风阵列以及手机近讲的语音识别率对比图
语音模型:优化识别效果 提高识别准确率
科大讯飞是国内首家将机器学习领域深度学习研究引入到语音识别声学模型训练的公司。讯飞使用带RBM预训练的多层神经网络,极大提高了声学模型的准确率,并率先取得了突破性进展。使用深层神经网络模型(DNN)后,语音识别错误率降低了超过30%。
同时,针对特定垂直领域的语音听写模型,在大量累计垂直领域语料的基础上,不断对模型进行训练,致力于提高识别准确率;基于用户的语音特征,建立个性化词条定制的语言模型,调整识别参数,持续优化识别效果,进一步提高识别准确率。
语义理解:基于机器学习排序算法优化正确率
对于语义理解准确率的提升,科大讯飞使用训练语料,基于机器学习排序的算法对用户说法的实际意图进行模型训练,预测用户的意图;基于种子数据和用户行为假设对海量日志进行挖掘,挖掘用户query和用户意图,加入到Learning To Rank模型的训练语料中,优化LTR模型的正确率;通过日志挖掘的结果辅以一定的人工确认。以下通过展示一句简单的对话了解在讯飞语音云中是如何被处理的。
开放共赢:构建汉语言 智能家居 语义库
科大讯飞根据目前智能家居产业中众多产品类型的具体使用环境,结合自身的技术优势和多年的数据积累,构建了全球首个汉语言智能家居语义库和应用控制场景库,从而为 智能家居产品 提供更为便捷的集成控制方式,根本上解决了智能家居在语音控制方面上的最后痛点。
目前,科大讯飞的智能家居语义库和应用控制场景库涉及智能家居八大细分产品类别,37+产品使用场景,10W+家居控制常用词令,具备海量的通用场景。同时,还支持个性化的语义定制。丰富资源的接入+绝对顶尖的技术实力+开放互建的共赢心态是科大讯飞智能家居语义库和应用控制场景库的综合优势所在,也是经得住市场实用环境考验的有力保障。
随着各产品领域的持续丰富和合作伙伴、开发者的不断加入,智能家居语义库和应用控制场景库还将持续升级,不断为智能家居产业发展推波助澜。
在智能家居、穿戴设备蓬勃发展的潮流未像今日这般波澜壮阔之前,科大讯飞就已经意识到语音引发下一代人机交互的历史革命,并在这一领域潜心研究、深耕细作达十余年之久。因此,在智能家居和人工智能产业化浪潮正式到来之际,科大讯飞抓住机遇,以开放的姿态、成熟技术、完善的体系投身智能家居控制领域,与行业共同进步、促进产业发展。
灵隆科技:DingDong智能音箱创造全新语音交互体验
DingDong智能音箱是京东和科大讯飞的合资公司北京灵隆科技与2015年8月推出的一款智能WiFi音箱。该音箱不仅带来了智能硬件交互上的全新体验,更是作为未来智能家居的入口布局整个智能生态。
DingDong智能音箱是一款能够实现远达5米远场识别的智能语音设备,远场唤醒率高达90%。通过全自然的语音交互方式,音箱可以完成在线歌曲点播、 智能家电 控制和生活助手的服务。云端曲库与百度音乐、喜马拉雅电台合作,集成了1000万首高品质歌曲,400万小时的有声读物和近1000电台,包括歌曲、交响乐、相声、小品、评书甚至黄梅戏,可以满足不同年龄用户的需求。
回归到音箱的本质,DingDong智能音箱对于音质的追求也是精益求精。通过采用360°声场设计,4个全频扬声器单元和一个重低音单元,支持无损音源的360°环绕播放。
作为一款智能设备,除了语音对话交互方式以外,DingDong音箱专门设计了灯环的交互方式。这个灯环能够根据声音定位你的位置。无论你在任何方向对它说话,它都能将灯环转向你,就好像一双眼睛看着你,在认真聆听你的说话一样,这是一种非常人性化的交互方式。
Savant:通过云端结合APP实现智能化控制
Savant语音控制的解决方案,主要是针对与科大讯飞在语音数据库的语音识别和语义识别两个大的方向来进行,通过云端的语音识别解析下发SDK数据包来触发Savant系统内的场景状态和功能开启。大量的关键字和触发语义,结合Savant可以前端自定义个人场景的全新App体验,达到一个现阶段,比较先进的智能化控制方式。
BroadLink:开放DNA Kit,带来更自然的语音交互
BroadLink DNA Kit拥有多项开放能力,致力于 智能家居 生态的互联互通,作为中间件,连接家电厂商与各大平台。当设备都联网后,在进厂时开放APP语音接口,并进行云平台解析。BroadLink与格兰仕、科大讯飞合作,整合了语音物联控制技术,现已可以通过APP用语音控制智能洗衣机、智能空调。未来,BroadLink将推出语音控制类的模块提供给家电厂商,可以进行语音语义分析,实现远距离的语音识别和控制,未来将引入人工智能,带来更自然的语音交互。
格兰仕滴嘀洗衣机
为洗衣机增加了“听话”的能力,只要动口,实现人机中文对话,支持普通话、粤语、湖南话、东北话、河南话、陕西话等多种方言互动。可以远程用手机语音启动洗衣,手机还能实时显示洗衣状态,结束时自动提醒,到家即可晾晒;父母不会用滚筒洗衣机,现在只要动口操作就行。
格兰仕智能空调
可以进行自然的人机对话,只要动口就可调节室温。无需使用独立APP,用微信就能远程控制空调,并可查看空调实时状态。同时,这款空调还具备“感知”能力,通过传感器让空调自动感知运行,与家中电器联动,真正实现了家庭自动化。比如,当门磁或红外感应到有人,空调将自动打开。
思美特:Wi-Fi+ZigBee结合移动APP自动定位语音控制
思美特早在2013年就已经推出了基于触摸屏和手机的语音控制功能,用户只需要拖入语音控件,并可根据需要任意增加控制指令集,如“回家场景”、“打开客厅灯光等” 、“客厅空调26度”等,即可实现语音控制。由于入口简单,功能可以任意自定义,正常普通话识别准确率已超过90%,整个过程不到1秒,几乎感觉不到延迟,所以自推广以来,深受广大老人和小孩的青睐。目前该功能支持全系列主控制器和任何iOS控制终端。
思美特常规语音控制示意图
除此之外,随着微信在2014年得到了普及,同期,思美特也在行业内率先推出微信控制,用户可通过关注公众号“思美特云”绑定主控制器,便可实现通过语音或文本控制和查询对应系统的任意功能,同样,控制的指令集均可在编程软件里面任意自由定义,任何控制功能都可以成为语音指令,大大扩充了用户的灵活性。
思美特微信语音控制示意图
思美特自动定位语音控制示意图
另外,自动定位语音控制技术是思美特2015年推出的基于Wi-Fi+ZigBee和移动APP的全新控制技术,所有的无线设备均为即插即用,在线管理,用户可以通过APP任意划分房间和区域,任意配置场景和智能指令集,当用户配置完毕后,语音控制会自动根据用户的配置和设备名称,自动定位房间、区域和场景名称等进行控制和反馈状态,无需单独设定和增加指令集。如“打开客厅吊灯”,系统会自动判断为灯光开关控制,同时自动定位到房间名称——客厅和模块名称——吊灯,同理,在APP的对话页面,便可自由对话,轻松实现对整个APP设备的控制功能。
中讯威易:移动APP语音控制智能家居
中讯威易早在2012年就实现了语音控制智能家居的功能,可以说是最早一批拥有语音识别、语音控制技术的智能家居厂家之一。
威易的语音控制方案大致包括以下三部分:
1.手机APP中的语音识别和语义转换模块;
2.智能家居网关;
3.各类智能家居节点设备。
冰壶语音识别
使用威易智能家居产品的用户打开智能家居控制APP,点击语音控制话筒图标,APP进入“语音控制”状态,这个时候用户通过语音发出“打开电视机”、“开灯”、“关窗帘”等指令会被APP的语音识别模块识别,并翻译成对应的智能控制指令发给智能网关,网关就可以指挥智能红外伴侣、智能灯光面板、智能窗帘面板等智能设备实现对应的操作。控制操作完成后APP会有语音播报反馈给用户操作结果,比如:指令已执行、指令错误等。