语音交互领域,亚马逊与京东必有一战?
很多今年去了美国CES的人都有类似的感受,无人机和VR的热度略减,智能设备的亮点乏善可陈。 人工智能 的应用和产品并没有超出去年初的期待值,而在热点缺缺的CES2017上,一款“旧”应用 亚马逊 Alexa成为了为数不多的话题。
作为Amazon的AI语音助理系统,Alexa+ Echo 的组合,在2014年11月,亚马逊非常低调的推出了这套声控兄弟组合。而在推出超过半年之后,智能扬声器Echo才得以在市场上进行销售。
有趣的是,与亚马逊对Echo的低调不同,媒体和业界却对这个产品给予了相当大的关注。因为Alexa与越来越多的应用和设备互联,在人工智能火热的大背景下,Echo摇身一变成为了智能家庭助手的新入口。
实际上,Echo并非在唱独角戏, 京东 叮咚( DingDong )智能音箱和 谷歌 Google Home都在智能家庭助手的角度,先后对Echo造成了挤压。那么,在三强鼎立的市场背景下, 语音交互 的格局要如何定义?Echo模式有没有机会产生下一个巨头?Echo在中国市场,有没有走出来的可能?
语音交互注定是巨头的游戏?
不谈Echo这样的智能入口模式 ,先来看看语音交互的商业模式。
其实,科技巨头们对语音交互早就有了明确的判断。很早以前,比尔·盖茨在美国卡内基-梅隆大学发表演讲时表示, 语音技术等自然交互技术在不久的将来会成为 智能硬件 的重要功能。 他认为,未来几年,互联网搜索将更多通过语音命令来完成,而不仅仅是语音识别。从简单的语音识别到智能化的人机语音交互,是语音技术未来发展的关键。这也许就是微软之所以会投入“小冰”的最初背景。
同样,乔布斯在世当初也已经认识到了“触控”这种人机交互方式的局限性。所在在2010年iPhone 4搭载Siri横空出世,乔布斯希望以此开启人工语音智能的人机交互革命。然而,当时的Siri只能做到取悦用户,发布仅仅数月后,绝大部分用户对Siri功能失去新鲜感。
必须承认,在“解放双手”这个层面上,人工语音智能在与人的交互上应该做到无需上手,只需要简洁的语音口令就实现绝大多数的手机使用场景,这是语音交互的迷人之处。
问题是,通过一个什么样的设备作为语音交互的入口才是最合理的。是智能手机吗?我认为手机不失为一个好的入口,但智能手机与用户的近距离,以及触控的便利性,很难让语音交互得到更好的应用场景。所以,一个像“音箱”这样的入口,开始显示出它在家庭助手角度的光芒。
所以,Echo,京东叮咚(DingDong)智能音箱和谷歌Google Home来了。
前几天看到一篇文章《中国Echo能以小米模式复制成功?》在分析Echo模式能不能诞生一个小米那样的公司,得出的结论是很难。我认为,这个分析的立足点本身就有存在很大的漏洞。 第一, 智能语音 交互设备,绝不是手机一样的通用产品 ,所以很难取得快速的市场效应,这对创业型公司是很大的压力。 第二,智能语音交互是一个成长中的生态 ,而手机建立在安卓的体系下,并不需要对生态的成熟等太久。
所以,在我看来。智能语音交互的成功,一定是需要巨头级的科技公司的。 第一,这需要对技术的持续投入 ,语音交互技术本身是一个重要因素,而背后的人工智能技术、 大数据 分析和应用场景的创新每一环都必不可少。 第二,语音交互之后,则是各种设备和应用的联接, 这种联接的背后就是生态的成熟,从目前成功的模式看,能够最终提供联接的也会是一个大公司。
所以,我相信,智能语音交互的未来,始终离不开巨头公司的身影,亚马逊,谷歌,微软和京东都会是其中有竞争力的玩家。
从场景看语音交互的未来格局
从市场上看,目前定位最接近的智能语音交互的产品应该有三个,分别是亚马逊的Echo,谷歌的Google Home,和京东的叮咚(DingDong)智能音箱。
首先,从推出时间来看,Echo最早,是2014年底推出的 。京东的叮咚(DingDong)智能音箱在2015年5月的CES上推出,时间上比Echo正式上市销售的时间要早。最晚推出的是Google Home,在2016年5月的I/O开发者大会上推出。
但如果从应用的场景扩展来讲,推出Echo的亚马逊和推出叮咚(DingDong)智能音箱的京东,在企业基因和利用语音交互优化 电商 的入口看,它们要比Google Home更有成功的机会。相比而言,面向智能家居联接的Google Home,并没有超出“家居”的概念本身。
所以说,Echo和叮咚(DingDong)智能音箱在未来必有一战,并不夸张。
去年的CES,叮咚(DingDong)智能音箱登陆拉斯维加斯,并与JBL签署合作协议,利用JD+智能音频解决方案,越来越多的音箱企业通过JD+智能音频联盟,步入到新的行业。。
今年1月的Alexa之所以在CES备受关注,是因为Alexa与福特、华为、LG,以及多家创业公司均推出集成Alexa的家电、手机、汽车,以及其他数码产品。让业界看到了Alexa在未来生态的拓展初见规模。
实际上,叮咚(DingDong)智能音箱在生态拓展上也非常成功,在2016年6月,叮咚(DingDong ) 开放平台的发布,已经吸引了滴滴和e袋洗等企业加入叮咚(DingDong)音箱的智能生态。2016年10月,京东智能云语音服务开放平台上线,用户可通过叮咚呼叫第三方服务,叮咚的家庭入口布局也真正完成了从交互到内容到服务的全面布局,也迎来了美的和小天鹅等硬件厂家的加入。
目前看,无论是叮咚(DingDong)智能音箱还是Echo,都处于市场的培育阶段。 Echo从上市以来,500万台的销量并不算惊艳,而叮咚(DingDong)智能音箱在中国市场的业绩增长也足以媲美面向全球的Echo,在京东平台上,目前叮咚智能音箱已经成为wifi类音箱品类销量第一。最后还有谷歌,当初斥资32亿美元收购了智能家居设备制造商Nest。尽管时至今日,Nest的发展不尽人意,但这对未来Google Home的发展也许会多了一些底气。
中国市场,必有一战的Echo和DingDong
首先从产品的对比而言,Echo的特点在于:围绕语音交互设计的产品,定位于家庭的应用场景,并通过开放系统,为产品赢来源源不断的第三方服务。
从技术上,亚马逊设计了一个名为“ARS”的自动语音识别处理系统。ARS由七个麦克风和一个音频信号过滤系统构成。七个麦克风组成的列阵能让Echo捕捉到环境中的细微声音,音频信号过滤系统过滤掉环境噪音,从而辨别出人声。使用ARS后,即使用户在25英尺(7.62米)之外发出命令,Echo也能够准确识别。
而叮咚(DingDong)智能音箱,同样是围绕语音交互而设计,但是应用的场景要更广阔。为什么呢?因为中国是全球互联网发展最快的地区,例如O2O这种模式也仅有中国能够走得通,这让叮咚(DingDong)智能音箱的应用场景变得更多。
技术上,负责设计叮咚(DingDong)智能音箱的灵隆科技,是京东和科大讯飞两家公司合资而来。所以它不仅基于科大讯飞的语音识别技术,比如远场识别技术和多轮对话能力。还包含了京东大数据对交互的分析能力。
其次,语音交互作为人工智能当中最重要的组成部分,也是需要大量的数据来进行学习。这也是为什么,我们发现很多的语音交互软件很难识别方言。所以,Echo是英语世界目前最合适的语音交互设备,而叮咚(DingDong)智能音箱则对中文语境更有竞争力。
这对于快速发展中的中国市场而言,也许根本等不到Echo的到来,就会令它失去切入竞争的机会。如今,叮咚助手服务已经接入百度音乐/喜马拉雅、京东购物、互动百科、E袋洗、有道笔记、JIMI、环境宝、中通快递、中华万年历/中国天气通等内容端。这也从侧面证明了叮咚(DingDong)智能音箱在中国市场目前所处的领先地位。
最后,无论是亚马逊还是京东,他们的业务主体还是电商,所以他们最优的应用场景还在于购物的环节。 换句话说,未来看Echo和叮咚(DingDong)智能音箱的竞争力, 可以先从两者对购物场景的接入能力开始 。不久前,京东刚刚推出了基于叮咚(DingDong)音箱的语音购物,而亚马逊则是在2015年5月推出了语音购物,所以在电商的真正战场上,两大智能语音交互平台的对决,才刚刚开始。