智能语音时代到来,谁在定义新时代AI?
编辑导语:智能音箱市场已经有多个玩家进入瓜分,阿里、小米、百度等都交出了各自的智能语音“答卷”。只是,当下的智能音箱是否真的足够“智能”?玩家们又该如何定义当前市场,搭建合理的智能生态?本文作者做了对应解读,一起来看看吧。
概要
人工智能技术风靡多年,比起唬人的虚幻概念,智能音箱是为数不多进入寻常百姓家的真实商品。不算太高的价格、简单易用的功能,让它迅速占据普通人的客厅和床头。如同重复过很多遍的故事那样,智能音箱从初创走向成熟、从固有模式中寻求变革,且依旧没有停下探寻着未来的步伐。
- 满足用户交互需求,语音识别不断成熟;
- 丰富产品功能范围,高端和智能化破局;
- 从分散走向整体,自建智能硬件生态。
新一代交互终端、深入家庭空间的流量入口、环境智能化的开启者……这些都是智能音箱的别称,但当你问小度或者小爱一个问题时,得到的回答可能却是“对不起,我没有听懂你在说什么”。
作为迈向智能家居的先导产品,智能音箱背负着太多概念,但现有的技术和功能是否能够支撑起这些概念,却被打上一个大大的问号。
三足鼎立的阿里、百度、小米,试图瓜分市场的新品牌,智能音箱市场未来何在?激烈厮杀后,哪些功能仍有可能的增长空间?
一、满足用户交互需求,语音识别不断成熟
2014年,亚马逊发布首款智能音箱Echo,两周内出货量破百万台。随后,多家互联网科技公司下场,智能音箱市场陷入混战。2017年,小米在生态大会上发布智能音箱产品“小爱同学”,智能音箱产品的战火燃到中国市场。
五年后的今天,小爱同学、小度小度和天猫精灵走入千家万户,占据的市场份额已超过95%,三足鼎立的态势已然形成。但能否回答“主人”的问题,智能音箱们仍需取决于要求是否复杂、语法是否正确、发音是否标准。
实际上,现有的更多用户倾向于让家中的小爱同学或是天猫精灵完成机械性的指令。这些机械系指令包括唱歌、开灯、定时等,因为指令明确且往往只有一两个词汇,智能音箱很少会在完成这些指令时犯错。
而对于稍复杂的指令,由于语音识别和NLP(自然语言处理)的不成熟,无论是用户输入的信息被机器识别,还是识别后的文本进行处理和理解,对于现有的智能音箱来说仍旧存在困难。尤其是中国市场方言的存在,为语音识别带来了更大的困难。
2011年,微软提出的基于上下文相关深度神经网络和隐马尔科夫模型,使智能语音算法得到长足优化。从海外市场看,以谷歌、微软、亚马逊为代表的巨头已经开发出具备人类级别的语音识别系统,以深度神经网络算法取代传统模型后,语音识别的单词错误率每年下降约18%。
相比于早期的智能音箱,海外厂商在语音识别和流畅度上层面上进行了技术精进,中国的智能音箱厂商也在交互和识别层面进行了大量探索和创新。
在交互领域,第一次让一问一答的生硬场景发生改变的,是小度智能音箱于2018年6月首次发布的极客模式(连续对话技术)。极客模式实现了人与智能音箱连续对话,改善了此前人机交互中无法多轮对话、多次重复唤醒的体验和回答生硬等问题。
而2019年出现的全双工免唤醒能力,则实现了“一次唤醒,多轮交互”,还能在与他人对话的同时互不干扰地实现人机交互,进一步提升音箱的理解和表达能力,扩大应用场景。
此后,国内头部智能音箱品牌都在交互形式多样化上展开了探索,如2020年3月份,小爱同学开始将手势控制运用到新推出的Redmi小爱触屏音箱上。可以预见,除了愈加精准的识别能力,多模态交互也可能成为未来人机交互的主流。
二、丰富产品功能范围,高端和智能化破局
根据艾瑞咨询2021年报告,智能音箱用户使用量最高的功能是播放音乐,占比达69%;其次是询问天气、播报新闻、播放故事和设定闹钟。这些被高频使用的功能,都是国内智能音箱在诞生之初就具备的。
因此,智能音箱的根本性技术需要革新,基础功能外的新增长点也需要发掘。自诞生以来没有明显突破的智能音箱,亟待颠覆性的新技术,让用户改变“新奇有趣”的初印象,用更严肃的目光看待产品。因此,产品分离出两条进化路线。
一部分产品选择向高端进军,追求音质和品质。
比如2019年,华为与帝瓦雷联手推出了华为Sound系列高端智能音箱,近日其还将发布新品Sound Joy,采用4单元2分频声学系统,包括柔性丝质材质的球顶形振膜和轻量化碳纤维复合振膜。小米2021年则与哈曼卡顿合作,发布了旗下首款高端音箱Xiaomi Sound。
另一部分产品则注重提升智能化体验。
首先,知识体系的构建是触发智能音箱新功能的尝试。 对于百度来说,在搜索模型中运用的海量用户行为信号和算法能力,可以成为小度音箱算法调优的基础;而百科、百家号等体系沉淀下的文本内容,则能够成小度小度回答问题时的海量召回池。
从场景上看,教育场景也确实是新的增长点,智能音箱的助教、育儿功能一直是厂商的重要宣传点。特别是近两年疫情影响下在线教育加速普及,智能音箱厂商加速相关布局。华为小精灵儿童智慧屏、天猫精灵CC10等产品,主打卖点都定在了教育功能。
其次,越来越多带屏音箱出现在市场。 小度系列通过带屏音箱实现销量反超,阿里和小米最新的产品形态同样是触屏音箱,如天猫精灵V10、小米小爱触屏音箱Pro 8。智能音箱从语音交互走向语音视觉交互,说明智能语音技术的发展还未抵达颠覆性时刻,文字/视觉/触觉的交互形态或许是突破技术瓶颈的捷径,也可能是触发新场景、新功能的动力。
这些尝试同样打开了新的消费场景,如果说语音交互可以提供播放音乐、对话类的娱乐功能;那么屏幕的出现则为智能音箱打开了游戏、影音、阅读的更多可能性,只要有对应的内容资源支持,理论上其体验与平板电脑无异。
受制于原有的有限功能和场景,音箱厂商一直在寻求突破口。产品存在的优化空间即是增长动力,也正是“干掉”试错的自己后,智能音箱才能迎来新生。
三、从分散走向整体,自建智能硬件生态
智能音箱的主要功能包括语音交互、内容服务、互联网服务和智能家居控制四个部分,语音交互和智能家居控制功能的实现,使智能音箱成为全屋智能的入口。因此,对于头部公司来说,智能音箱仅仅是其智能化宏大版图的先行者。
虽然,动辄上千元的配套设施劝退大量普通消费者,但成套智能家居系统并非停留在概念层面。事实上,包括全季、亚朵、秋果在内的商务连锁酒店早就以智能音箱为核心,建立起一整套智能居住系统,智能音箱们联结起的智能化家居版图正逐渐渗透进市场。
随意走进一家商场里的小米之家,烤箱、空气净化器、电视摆在显眼位置,让人误以为置身于一家微型电器城,小爱同学和其他智能家居产品的联动效应依托于成熟的配套体系,强大、完善的硬件生态链体系也为小米智能音箱产品创造了良好的竞争优势。
具体来看,在小米的整个生态中,其“1+4+N”AIoT战略就是将小爱同学作为交互中心,将小米空调、烤箱、扫地机器人、洗衣机、台灯、冰箱等种类繁多的家电,纳入同一个家庭智能系统中。
而对于供应链优势不那么明显的百度和阿里来说,发挥互联网头部企业的优势,依托外部强大的智能设备合作网是其发力的重点,它们依托外部强大的智能设备合作网络,将智能音箱接入更多非品牌旗下的智能设备。
2021年,天猫精灵官方公布的接入品牌超过1000个,智能产品超过5000款,可连接智能家居设备超2亿;小度智能音箱可连接家电品牌超200家。
中国智能音箱行业的三大龙头纷纷推动智能音箱生态链功能形成,可见产品生态链形成对于智能音箱需求促进起着重要作用。而从另一面看,智能家居的体验升级与入口设备的进化紧密相关,音箱不得不更多地承担起“联结”的智能。
从这个层面上看,智能音箱与音箱渐行渐远,作为智能家居的入口之一,智能音箱正在以全新的产品形态面向消费者。
面对未来的智能家居以及更多的智能场景,智能音箱或许只是一个进入的通道。但是否能够打破电子设备、消费电器、移动设备之间的壁垒,使它们能够充分融合、互通,更容易地共享资源,将是智能音箱要背负的更重要的责任。
本文由 @新盟财经 原创发布于人人都是产品经理,未经作者许可,禁止转载。
题图来自Unsplash,基于CC0协议。