语音识别要想落地C端,光联姻社交软件还不够
纵观人工智能所涵盖的各种技术,我们发现其中的语音识别与图像识别最先实现了商业化。不过,照目前情况看来,不管是它们中的哪一个,C端市场似乎都是其商业化进程中难以触碰的一个点。
就在近日,谷歌的社交软件Allo被爆出将在本周上线。值得一提的是,区别于微信等社交软件,Allo同时身兼着另外一个身份——语音助理。在这两种属性结合的背后,有人看到了语音识别技术在C端市场的希望。但是,这场“春天”真的是近在眼前吗?
“语音识别+社交软件”的新组合
以Allo为例,它所搭载的是谷歌最新开发的语音助理Google Assistant,其集合了谷歌目前为止最先进的语音识别、自然语言理解等诸多核心技术。在今年的开发者大会上,谷歌发言人表示,Google Assistant已经可以兼容第三方服务,包括Ticketmaster、Spotify、Uber以及Whatsapp等等。这或许也就意味着,用户可以在Allo上通过Google Assistant来享受这些服务。
至于Google Assistant在社交软件上如何利用语音识别向人们提供服务,依据Allo现有信息,我们可以简单的做一个设想:A和B两个人正在聊天,主题是小时候的梦想和兴趣爱好,当A称自己在小学想学跳舞的时候,Google Assistant实时给出了一个小页面,而上面都是一些附近舞蹈教学的信息。
当然,除此之外,用户也可以单独与Google Assistant进行对话,只要在文字的最后@一下语音助理,就可以直接跟它点对点的聊天了。
语音识别或将打开社交软件新征程
出于联络情感、搭建工作关系等各种需要,人们每天都会用到社交软件,甚至到了离不开的程度。而说到语音识别,却很少在社交软件上看到。不过Allo并不是第一个将社交软件与语音识别技术相结合的产品,其实早在今年4月份,Facebook就宣布允许企业在Messenger平台上搭建聊天机器人了。
在具体应用上,Facebook的聊天机器人可以帮助用户订花、预定外卖、获得银行账户通知提醒等。但是,在实际体验中,它仍有着不可忽视的缺陷:比如问它能否发一些科技新闻,它却发送了一则关于澳洲树袋熊的新闻,由此就体现出了其语音识别等方面的技术缺陷。
另外,当前的社交软件正在一步步的向多功能化发展,比如说购票、支付、充值等等。在这样一个社交软件被大量第三方服务充斥的时代,语音识别似乎可以成为社交软件的一个制胜点。一旦搭载了语音识别技术,当用户购买电影票的时候,只需语音下达命令,语音助理就可以提出建议并完成下单,这一过程较之传统的购票流程将大大缩减时间。
以此来看,语音识别在社交软件领域也是可以打下一片天的。但是,要想真正实现落地,鉴于以下几点原因,却还需等待一段时间。
语音识别“落地”C端的关键所在
当前,语音识别在社交软件中的主要表现是将语音转换成文字,但这只是冰山一角。而事实上,要想在社交软件实现真正落地,语音识别还得等待三个因素的成熟:
首先就是技术的成熟。关于技术层面,说再多都是老生常谈。其实,单从表面的语音识别来看,这个技术已经相当成熟了。此前,镁客君曾对Siri、科大讯飞、思必驰、度秘等软件进行过测试,结果显示,哪怕有噪音干扰,科大讯飞等产品的语音识别能力也是相当强悍的。
然而,要想落地,其关键还是语音识别背后更深层次的自然语言理解。只有在理解的基础上,语音助理等语音识别衍生品才能真正懂得用户的需求,从而进一步的优化服务,而不是出现Facebook聊天机器人的那种低级错误。
其次是社交软件第三方服务的成熟。以微信作比,目前的微信的第三方服务商包括艺龙、滴滴、微票儿、同程、大众点评等,虽然这些服务包括了生活的方方面面,但使用的人还是少之又少,就像镁客君从来都是直接去第三方服务的APP寻找服务。
从另一个方面来看,这种情况也指出微信在第三方服务还有很大的成长空间。作为当前市场份额最大的社交软件,如果微信能够将第三方服务发展成熟,一旦启用语音助理,那将是一个质的飞跃。这时候,不仅微信能够再次巩固自己的地位,对于第三方服务提供商以及语音识别公司,也将是一个利好机会。
最后则是与用户习惯契合度的成熟。这方面,Allo的语音助理就是一个很典型的反面教程。哪怕服务再智能,也没有人会喜欢自己与朋友聊天聊得正欢时,一个页面突然出现并打乱原有的节奏和氛围。
另外,人们对于服务追求的是一种“极致”。将这种要求放到社交软件的语音助手上,就意味着操作的简便。譬如将聊天与服务放置于同一页面,而且语音助理随叫随到,也不会干扰聊天过程,这就是一种语音服务的“极致”,也是语音识别在社交软件上落地的先决条件。
如果想要实现落地,“用户习惯”将是一个很关键的因素,因为这会直接影响到产品的体验效果。一个产品,只有用户体验到位,才能让其买单,进而站稳脚跟。
结语
从理论上讲,语音识别与社交软件的结合所带来的不仅是社交软件的颠覆,更是语音识别厂商的希望之所在。
不过,如果将其拿到现实中,盈利就是一个必须要考虑到的因素。毕竟在B端市场,厂商可以通过授权以获取收益,但是在C端市场,这还是一个未能解决的问题。因此,鉴于以上多种因素,所谓语音识别在C端市场的“春天”,应该还远未到来。
更多深度分析,关注钛媒体微信号:钛媒体(ID:taimeiti)
钛媒体微信二维码