思必驰技术分享:车载语音交互的需求及挑战

雷锋网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

对于一个司机来说,汽车智能化最重要的一点,就是在开车的时候不用手也能做一些驾驶以外的操作,而这一行为的实现多半依赖语音技术的发展。目前国内做语音语义相关的公司也都注意到了车载领域的前景,纷纷针对这个领域做起了语音交互方案,思必驰就是其中一家。

思必驰技术分享:车载语音交互的需求及挑战

昨天,思必驰在深圳做了一场产品体验沙龙,用他们的话来说,就是一场“裸技术分享会”,在会上向大家展示了他们最新的车载对话操作系统AIOS的3.0版本,通过这次技术分享,也让大家了解了一下语音交互系统对车载领域的重要性。

VUI语音交互界面的概念

在汽车驾驶环境里,因安全因素限制,驾驶员在行驶过程中能做的额外操作并不多,在传统汽车中,除了驾驶操作之外,像接听电话、娱乐等功能的操作都被集成在了方向盘中,这样让驾驶员手不离开方向盘就能够完成这些事情,但是随着“智能汽车”概念的兴起,网络社交、智能导航等功能也出现在了汽车中,最开始这些功能都被塞进了车机、智能后视镜等设备中,但是多数需要驾驶员手动操作,这样就为处于驾驶状态的人带来了非常大的不便,就此问题,人们发现,语音操作变成了刚需。

在语音操作刚刚兴起的时候,算法十分简陋,识别率低且只能完成及其简单的操作,这样完全不能称之为“智能”, 在思必驰技术分析沙龙的现场,思必驰产品总监张岩在现场提到了一个VUI的概念,也就是语音交互界面(Voice User Interface),这个概念说白了就是把二维的屏幕操作界面变成了由语音系统构成的操作组织。

在车载领域,用户操作从最初的无界面到现在的GUI(图形用户界面),正在朝VUI方向发展,这也是趋势所在, 用最有效的语音引导方式帮助用户完成操作,这样不但能够保证驾驶的安全性、大幅度节省人力成本,还能够将用户从枯燥、繁琐的驾乘活动中解放出来。这种VUI理念除了在车载领域之外,还可与智能家居、智能机器人等领域的语音交互中去。

VUI在车载领域的需求及挑战

既然是交互界面,就要保证操作的准确、便捷、高效,人们在下达语音命令的时候,要保证机器能够快速的反馈和执行,这一点在车载系统中尤为重要,因为驾驶过程中,对智能车载系统的整个操作流程全都需要语音来实现,目前来看,需求大概在以下几点。

导航中的快捷交互:

导航对于车载系统来说是绝对核心的功能,然而目前大部分导航还没能实现语音控制,或者只实现了“语音查找目的”等简单的功能,而在VUI中,驾驶员说:“我要去XXX地方”,机器应该立即反应并规划路线,告诉驾驶员距离、预估时间等信息。在整个交互中,驾驶员也可以说明诉求,比如“躲避拥堵”“最短距离”等,说出诉求后,机器也会相应的调整路线规划。

跨领域打断:

对于“与机器对话”这件事来说,让人最苦恼的地方无疑就是机器笨又啰嗦,比如你问它一件事情,有时候它就会叨叨叨说一大堆的话,其实在这个过程中,驾驶员可能听到一半就能理解机器在说什么了,但通常情况下,如果机器没有说完,是不能去执行下一个任务的,听一个冷冰冰的机器音啰里八嗦上一大段,确实挺让人不耐烦的,尤其对患有路怒症的老司机及其不友好。

思必驰技术分享:车载语音交互的需求及挑战

采用思必驰语音方案的智能后视镜

而思必驰在这点上做了改进。在新版本的对话操作系统里,做了打断功能,驾驶员在跟机器交流的时候,可以随时打断机器的说话,让他去执行其他任务,这种打断还能在导航、音乐、电话、微信等功能里灵活转换,不用返回主界面,无需再次唤醒,直接进行语音操控,让机器做你临时想做的事情。

合成音切换:

在机器语音这个方面,其实有个小细节值得大家关注一下。用过Siri的人都应该了解,机器人说话大都是一个字一个字的蹦,不连贯的机器音让人听了想睡觉,除了标准的语音之外,做一些明星合成音,比如林志玲、郭德纲等,能够增加不少的趣味性,思必驰活动的现场,他们也为大家演示了在这方面所做的工作。

思必驰技术分享:车载语音交互的需求及挑战

语音现场合成

网络社交功能:

社交操作在车载领域的比重确实不小,而打电话发短信这种社交方式对现代的网络社交来说,肯定是不够用的,而司机开车时用 智能手机 进行社交应用的操作是非常危险的事情,所以把网络社交应用集成到车载系统中,并且全权用语音进行控制就显得尤为重要。雷锋网 (搜索“雷锋网”公众号关注) 在思必驰技术分享会中,看到他们把微信集成到了车载系统中的演示,驾驶员可以在开车时, 直接用语音唤醒微信,并说明给谁发,发什么内容,发语音还是文字(文字是把语音转成文字,不需要用户手动打字),甚至在聊天时想约见,只要对方给你发个具体位置,系统会自动转接到地图上进行导航,非常方便。

思必驰技术分享:车载语音交互的需求及挑战

除了上述刚需和新鲜功能之外,音乐电台等娱乐方面的语音交互、路况查询等实用的基础功能也需要在VUI中实现,换句话说,车载语音操作要更智能,VUI就得像GUI一样完全成熟才行。

语音交互确实是一项能够提升人们操作体验的工具,在无人驾驶汽车正式来临之前,语音交互绝对是能够提升车内操作效率和驾驶员安全系数的神器,但是这一切都在整个语音系统的高精准、高效率的前提下的,这个领域目前还只处在一个不太成熟的阶段,还有很大的提升空间。相信在未来的各个领域,特别是车载这种需要语音辅助的地方,VUI在某种程度上一定会取代手动操作。

随意打赏

智能语音交互思必驰语音交互需求
提交建议
微信扫一扫,分享给好友吧。