最自然的交互才是最好的交互，蘑菇车联打造全场景语音交互车载OS

亿欧网 • 5年前扫码分享

“最自然的交互才是最好的交互，车内场景下语音交互才是最自然的交互，蘑菇OS从设计的第一天开始就致力于打造全场景语音交互的车载OS。”2019年10月18日，蘑菇车联副总裁、蘑菇OS部总经理邓志伟在第二届汽车人机交互与智能座舱国际峰会上表示。

从工业革命到信息革命，伴随着机器智能化的高速发展，人类与机器的交互方式经历了若干个时代的演进，从最早的机械式操作到实体按键，再到触摸屏，手机的出现进一步推动了近20年来最大的一次人机交互变革。所见即所得的触摸式交互极大的提升了人与机器的交流效率，为终端场景下的人机交互方式提供了最佳的用户体验。

随着车联网、物联网的蓬勃发展，人机交互方式面临了全新的挑战。在传统的手机触屏操作时代，由于人的视觉、听觉、触觉是完整释放状态，因此90%的触屏交互辅以10%的语音交互带来了移动终端时代的完美体验。而在车联网、物联网时代，因为操作环境与机器的复杂化，人体自然感官处于受限的状态。特别是车联网领域，在驾驶舱的环境中视觉与触觉都受到高度约束。如此复杂的约束环境中，语音交互成为了车载场景下最佳的交互方式。

过去几十年里，车企一直致力于为用户提供更好交互体验，例如奔驰首先提出的方向盘按键及鼠标式触摸板、奥迪的MMI、以及宝马的idriver智能驾驶控制系统等，都极大地推动了人车交互的变革。信息时代与人工智能时代的技术突破，赋予了行业更多的机会。

“在这样的时代背景下，蘑菇OS的交互设计理念就是为用户提供最好的交互体验。”邓志伟表示，“蘑菇OS打造的全场景VUI（Voice User Interface），将从目前90%的语音辅以10%的触摸交互，演进到最终实现100%的全语音交互。”

“语音交互最大的难点在于语音识别与语义理解，泛场景化的语义理解一直是业界最大的难题，即使机器学习的出现也不能解决泛场景化的连续交互问题。这也是为什么大家在使用手机、音箱等包含语音交互的终端场景里面始终感觉语音交互体验不好，人工智能比较‘傻’的原因。”邓志伟现场坦言，泛场景化语音交互场景依然面临严峻的理论难题与体验缺陷，“但是在车载领域，我们迎来了全新的机会，由于车载场景封闭化、场景化、归一化的特点，使我们在车载领域实现全场景语音交互的优质体验成为了可能。”

“目前蘑菇OS的用户月语音交互次数已经突破了三亿次，我们发现80%的语音交互内容出现了惊人的场景相似性，这为蘑菇OS的全场景语音交互带来了巨大的启发。”

蘑菇OS的VUI，定义了两大类语音包场景：通用语音包服务与个性化语音包服务。

通用语音包服务通过用户相似性场景的集中抽象，通过渐进理解、意图跟踪、智能纠错等技术的运用，对用户的意图进行场景化分析，目前已支持涵盖车辆控制、娱乐、安全、生活服务、信息等5类需求81个细分场景；通过大量模型训练与机器学习，配以底层语音引擎技术，能够迅速理解用户意图并提供精准反馈；通过场景引擎的定义，支持上下文多轮对话，能够实现边听边说边想，大幅缩短响应时间，用户可随意插话，更贴近人们日常交流习惯。蘑菇通用语音包服务的理解准确率超过97%。

蘑菇OS的VUI同时推出了个性化语音包服务，可以通过声纹识别、声源识别、语言及语调识别，满足个性化服务需求。通过声纹识别提供定制服务，包括空调温度、座椅角度、音乐喜好等；通过声源识别用户位置，当识别到“调低温度”指令时，即可调节声源位置的温度；此外，个性化语言包系统还可通过语言及语调识别用户情绪，实现差异化内容回复。

在百年的汽车发展历程中，汽车产业的先驱们在不断的探索人与车的交互方式，力争打造最优质的人车交互体验。邓志伟表示，“人工智能时代的到来，给产业带来了新的机遇，蘑菇OS期待沿着汽车产业先驱探索的步伐，与车企的伙伴们一起打造信息时代全新的人车交互体验！”

本文来源亿欧，经亿欧授权发布，版权归原作者所有。转载或内容合作请点击 转载说明 ，违规转载法律必究。