智能音箱:一场提前打响的抢滩登陆战
7月12日晚,大望路SOHO现代城,一场几十位媒体记者参加的 人工智能 交流活动现场,角落里的智能语音 机器人 冷不丁地开口汇报系统更新提示,咖啡馆的主人阳淼急忙打圆场,“店里有三个智能音箱,都是厂商送的”。
与此同时,距北京1200多公里的杭州某广场上,87岁的前高级电力工程师蒋先生正用刚买了半个多月的智能音箱给老伙计们放《小苹果》。为了能把这个专为家庭场景设计的新玩意儿带出家门,蒋先生专门去学习了手机设置个人热点。
“若琪,关灯”,而在广场不远处一家书店里,准备打烊的黄老板向他的语音助手发号施令。作为一个科技产品发烧友,Rokid第一代产品“若琪·外星人”甫一发售,黄二就成为了第一批下单的天使用户。此前,他还试水过叮咚音箱和“公子小白”。
这些,正是智能音箱在国内覆盖的主要人群和消费场景:追赶新事物和唯恐被新事物抛弃的人,或者,是科技从业者。
如果说在各种“共享系”产品之后,还有哪个领域能吸引互联网大佬们抢滩登陆的话,智能音箱大概能算一个。
在大部分用户的认知还停留在《澳门风云》里那个一口四川口音的管家机器人时,智能音箱的风口争夺战已经悄然开始。
过去三个月,关于智能音箱产品的发布会一场接着一场, BAT 也在一个月内先后入局。
市场上弥漫着抢占山头的不安和狂热。在智能路由器濒临破产之后,智能音箱被历史和创业者选中,承载起人工智能家居入口的厚望。
一场智能家庭的抢滩登陆战,不经意间已经悄悄打响了。
爆发
天下武功,唯快不破?
这一切的起源,都是 亚马逊 CEO杰夫·贝索斯的偏执与坚持。
2014年11月,亚马逊Echo面市,成了第一个智能音箱的爆款。一组对比大概可以直观表现出Echo的成功:Echo面市后,两周内销量即达100万。而iPhone用了70天才达到同样的订单数。研究机构预计,今年Echo销量将突破1100万台。
技术公司们在多年前就意识到智能语音互动会成为下一代技术产品最核心的用户入口,但这些语音识别助手及搭载他们的硬件产品似乎并没有戳中用户痛点,直到亚马逊Echo出现。
察觉到市场变化,苹果、谷歌和微软也在智能音箱领域开始行动。但它们已经给了亚马逊两年的空档期去优化Alexa。Alexa平台接口开放后,上万名开发者加入,1200余种功能和应用被开发出来,Alexa的用户活跃度和粘性越来越强。
根据市场咨询公司eMarketer发布的报告,美国智能音箱用户约70.6%是亚马逊用户,谷歌只占了23.8%,而联想、LG、哈曼卡顿等只能瓜分剩余的5.6%。
此时发力,似乎为时已晚。幸运的是,中国市场除外。
时任京东智能产品中心总监的魏强,可能是Echo的国内第一批尝鲜者。对标亚马逊,京东当年年底就决定与科大讯飞合作,2015年初正式成立合资子公司灵隆科技,后魏强担任CEO。
2015年3月,亚马逊Echo面世仅4个月后,京东的第一款叮咚音箱正式立项。
快,成了这场战役的第一个关键点。
魏强告知合作的代工厂,研发周期最多五个月。代工厂的老板目瞪口呆,一度不想接这个单子。
要知道,即使是一款传统音箱,研发周期一般也在八个月到一年。“但这就是互联网的打法。国际市场上已经有产品发布了,必须要抢时间。”
时间!时间!这个词也成了Rokid创始人祝铭明从阿里离职的原因。人工智能Ph.D出身的祝铭明在创业之前掌管着阿里巴巴最神秘的M工作室,负责深度学习、视觉和自然语言处理研发。
2014年7月,为了在AI赛道抢占先机,祝铭明选择离开阿里成立Rokid:“接下来的两到三年后,人工智能会有突飞猛进,我们必须提前起跑,才能在那时候与有能力、有实力的企业同台演出。”
2014年7月,Rokid在杭州成立,成为国内较早涉足智能语音助手的公司。
至今为止,灵隆科技已经推出了6款智能音箱。不久后,Rokid也将发布它的第三代智能产品。
“产品迭代的速度要快。”在媒体人阳淼看来,对于创业公司来说,迭代速度要足够快,才有可能在与BAT同场竞技时打下自己的一片天。
然而,BAT入局的速度超乎想象。
4月25日,腾讯推出智能语音助手“腾讯叮当”(其项目开发团队隶属于MIG即移动互联网事业群),对标亚马逊 的Alexa,作为腾讯在人工智能领域的探路石;
4月28日,百度和小鱼在家联合发布新款人工智能视频通话机器人“分身鱼”,搭载百度对话式人工智能系统DuerOS;
6月22日,腾讯云(隶属于腾讯SNG即社交网络事业群)发布了智能语音解决方案——“小微”;
7月5日,百度AI开发者大会上,DuerOS开放平台正式亮相;
同日,阿里人工智能实验室也发布了一款自主研发的中文语音理解引擎AliGenie平台及智能音箱“天猫精灵X1”。
战场
一公里以内,112家工厂
从团购兴起时的“百团大战”,再到去年的VR热潮,直至如今的共享单车。风口之战重复上演,智能音箱也不外如是。
作为科技产业的风向标,无论风口转向哪儿,随风而动的深圳南山区创业者们总能从中掘金。位于深圳南山区的聚点科技,就是此次受益者中的一员。
作为无数智能音箱方案商中的一个,靠着和大品牌合作定制智能语音交互产品,聚点科技挖到了智能音箱的第一桶金。但它依然面临着残酷的竞争:
“深圳南山区一公里以内有112家公司做语音智能。”喜马拉雅FM硬件事业部总经理李海波的这句话最近流传很广。“它们不知道市场、用户在哪里,只知道趋势来了,我得赶紧跟上。”
魏强去深圳考察叮咚音箱供应链时,被大大小小、各式各样做智能语音相关的公司吓到了。这些公司有做产品的,有做方案的,还有做包组的。“现在好像出门不说自己是做智能语音相关产品的,都不好意思跟人打招呼。”
不同于C端市场的风平浪静,在B端,从初创团队到行业巨头,从平台到硬件到内容,从人工智能技术提供商到硬件设备厂商再到传统音频企业,语音智能市场群狼环饲。
传统硬件厂商也不甘错失风口。在被百度收购之前,人工智能公司KITT的联合创始人姚旭晨在接洽传统硬件厂商时,清晰地感受到了他们的恐惧——追风者害怕错过下一个技术浪潮。
技术服务商如科大讯飞、云知声,硬件产销渠道方如京东、小米,传统家电厂商如美的、海尔,人工智能初创企业如Rokid、灵隆科技,再加上携带技术及海量用户数据的BAT,智能音箱的战场上可谓各家汇聚。
作为入局的创业者之一,祝铭明感到大军压境,“接下来半年,寻求报道的智能音箱、智能语音产品会非常多,但我确信,他们中的绝大部分人并没有想清楚自己要做什么。”
2013年夏天的百团大战,2014年夏天的智能手表,2015年夏天的VR眼镜,2016年夏天的O2O,2017年夏天的共享单车……如同之前的每一场风口之争,不想错过下一场科技革命的红利,同时又出于被颠覆的恐惧,追风筝的人又跑了起来。
而不好的消息是,业内人士认为,智能音箱市场上,最终幸存者不会超过五个。
战略
诸神之战,创业者有的玩吗?
游戏已经开局,跟风者和英雄都已入场。
7月5日,百度展示了All in AI的阶段性成果——对话式人工智能系统DuerOS。基于DuerOS,百度推出了小度智能设备开放平台,为开发者提供包括硬件和软件在内的一揽子解决方案。对标谷歌,百度希望将DuerOS打造成人工智能领域的“安卓系统”。
2017百度AI开发者大会上,度秘工程师为大家展示DuerOS对话式人工智能系统
在百度雄心勃勃地宣布要将DuerOS打造成AI领域“安卓系统”的同一天,阿里巴巴也发布了一款智能音箱“天猫精灵X1”。“天猫精灵X1”的背后,是阿里人工智能实验室自主研发的第一代人机交流系统 AliGenie。
6月份,腾讯也正式推出了基于腾讯云的小微智能服务开放平台。接入小微的硬件可以快速具备听觉和视觉感知能力,能够让 智能硬件 厂商实现语音人机互动和音视频服务。小微的三大平台:硬件开发平台、Skill技能开放平台、服务机器人平台,可以赋能开发者,为合作伙伴或开发者提供多种服务。
平台战略是BAT的一贯打法。无论BAT是否推出硬件产品,其最终目的都是销售硬件背后的平台。此外,百度的AI技术和算法、阿里云的算法和 大数据 、腾讯的海量版权和计算能力,三大巨头各自拥有不容小觑的实力。
“巨头一旦入局,创业公司所能扮演的角色似乎就比较有限了。”PreAngel投资总监蒋锴担忧,从算法技术、硬件方案、内容整合乃至整个生态,包括BAT、科大讯飞、京东等在内的巨头并没有给创业公司留下什么机会。“整个产业链上,没有哪个环节是巨头覆盖不了的。”
事实上,如今已经入局的每个大玩家,都自带一套优势体系。比如,在硬件渠道上占优的京东也有自己的大招,毕竟亚马逊Echo的成功,也离不开其电商平台的铺货能力。
京东微联计划则让京东在这次抢滩中更有底气。微联是国内第一个自主研发的跨品牌、跨品类的智能家居互联互通平台。京东联合科大讯飞出品的叮咚音箱天然地可以控制加入京东微联计划的诸多家电。这让智能音箱这一未来智能家电入口更具现实意义。据悉,同样具有强大第三方支持度的小米在月底也将推出智能音箱产品。
音频内容平台喜马拉雅对自己切入智能语音市场的定位也很清晰:做好内容产品在智能终端的用户体验。6月18日,喜马拉雅联合人工智能公司猎户星空推出小雅音箱,希望把借助小雅形成的内容整合能力输送给更多第三方——说白了,也是一个不卖硬件卖平台的。
看起来,唯一没有明显优势的玩家,可能就是独立的创业者了。以Rokid为代表的创业公司则试图另辟蹊径,在巨头以邻为壑的生态圈里,作为不存在对抗关系的第三方,Rokid希望获得更多巨头的开放接口。比如,小米旗下的米家智能家居就已全面向Rokid开放。
将用户体验做到极致,是Rokid打开市场的另一把钥匙。每次接受采访时,无论是Rokid创始人祝铭明还是产品负责人向文杰,言必提用户体验。而用户体验四个字,涵盖了唤醒词、反应时间、外观设计、远场识别距离甚至是一句话的语音语调。
“我们花了两年的时间在打磨产品的细节和体验上。” Rokid产品负责人向文杰说。就拿唤醒词来举例,市面上大部分语音交互产品的唤醒词都是三音节以上,比如“hi,Siri”或者“小白小白”。而Rokid的唤醒词只有两个音节:“若琪”。这更符合中国人的语言习惯。要知道,仅仅为了这个双音节的唤醒词,Rokid团队就花费了半年时间。
因为想知道用户的使用体验究竟怎么样,这群较真儿的技术宅们甚至组了一个博士团在线下零售店蹲点半个多月。
未来
一场被提前打响的冲锋
阳淼曾在2016年写过一篇关于智能音箱的文章,其中有这样一句话:如果人们一开始不习惯对家电发号施令,点一首歌会让他们自然得多。但一年后,阳淼坦言,目前市面上的智能音箱,他一款都不会买。
“我有一个购买前提,它必须是不光能听音乐,还必须能控制尽量多的东西。”要想达到阳淼的这个要求,要么就重新置办一个家,全部用符合该智能音箱系统标准的家电;要么就是这个智能音箱能实现现有家电的最大兼容。“目前还没有产品能做得让人满意。即使这方面走得最快的叮咚音箱和Rokid,也只能控制特定的家居。”比如叮咚音箱只能接入支持基于京东微联的Joylink协议的电器,Rokid能控制的主要是小米智能家电。
有这样一种说法,要检验一个产品是不是爆款,就去华强北看看有没有山寨版。令人失望的是,就连正版智能音箱产品都在华强北商户中难觅踪迹。智能音箱行业,企业与消费端用户存在断崖式差异。
想象一下这个场景: 未来你可能不但需要三个以上的智能音箱来控制不同的家电,还需要拿个小本本记上:我的冰箱是京东的,电视是小米的,空调是腾讯的……
另一方面,现有智能音箱的语音识别精准度也差强人意。虽然几大技术提供商号称识别准确率在90%以上,但在复杂的家庭场景中,智能音箱在消费端的唤醒情况并不理想。
智能音箱强调“音箱”属性,只是阶段性的策略。“用户首先要买一个有用的东西。”贝索斯当初选择将Alexa智能语音助手平台落地到音箱这一具体场景上,最主要的原因是给用户一个购买理由,在生态尚不成熟的时候,通过音乐播放增加用户与音箱的互动频率,增大用户粘性,提早占位培育市场。
但如果把家庭对音箱的需求直接从美国移植过来,似乎不符合中国特色——普通家庭没有使用音箱的习惯,音箱发烧友又看不上智能音箱的音质。
不能打电话、不能叫外卖、不能发快递、不能多轮交互……入局者大多忙着抢占市场,没有多少精力去关心产品的服务和用户体验升级。“功能会随着产品升级越来越完善,只要你先把产品带回家。”这似乎成了智能音箱厂商的统一话术。
B端市场的火热与C端市场的不买账形成鲜明对比,市场尚待培育,产品亟需迭代。 在又一场智能家居入口大战中,巨头尚未决出,追风者的结局已有史为鉴。