专访谢殿侠:别只盯着智能音箱 语音交互将重构 APP

IT思维  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  
作者 | 小羿

“ 智能音箱 终于火起来了。”

见到谢殿侠,他正坐在北京一个临时的办公室中,第一句话脱口而出。

从上海到北京,谢殿侠创立的海知智能已经历了三年的时间。作为专注中文语义理解的创业公司,海知智能体量不大,但机会风暴正在袭来。

专访谢殿侠:别只盯着智能音箱 语音交互将重构 APP

智能音箱,在中国事儿有多大

亚马逊Echo的火热已经蔓延到了中国。在看到了语音交互的发展前景之后,中国科技企业,不管是巨头公司,还是创业机构,亦或是传统制造厂商,都开始进入智能音箱领域。

但一个悲催的事实是,智能音箱在美国已经具备了年销量千万级的市场,在中国这一数字目前不到百万。

差距为何如此之大?在谢殿侠看来,中国智能音箱市场起步速度不会很快,成熟度也不会那么高,这是因为智能音箱在中国家庭中扮演的角色远没有美国重要。

“为什么亚马逊成功了?因为Echo的美国用户多是家庭主妇,习惯于在做饭、休整庭院的时候与Echo交互。比如Echo的一个重要使用场景是厨房,美国家庭主妇一般是在做饭的时候听背景音乐。这是因为美国人的厨房大多是开放式厨房,而且他们做饭相对中国的煎炒烹炸来说显得安静。”谢殿侠分析到。

谢殿侠认为,相比之下,中国没有形成家庭主妇的社交群体,晚上又因为应酬较多不在家,而中国家庭一般没有开放式厨房,大多数的习惯是看电视。这几点原因导致中国音箱用户少,使用场景、时间段都被压缩。

“所以,即使中国厂商可以把智能音箱做得比Echo更漂亮、更便宜,内容服务也更好,但是纯粹作为单品音箱来讲,其成功的程度和速度都不及美国。”谢殿侠说到。

有业内人士认为,目前投放到智能音箱上的“热钱”都已经砸进来了,初期的市场规模一定会起来。“我认为中国智能音箱市场明年销量能达到千万台的级别”,谢殿侠认为,像小米将价格打到299元,其实是想切传统蓝牙音箱的蛋糕,如果能将这部分存量市场进行转化也是不错的。

“后面就是产能的事情了”,谢殿侠说到,“下半年如果你看到很多智能音箱降价,或者市场上出现大量一两百元的智能音箱出来的时候,都不会是令人惊奇的事情。”

“但中国智能音箱的活跃度、黏性、留存率未必有美国市场那么高。”谢殿侠补充到。

去中心化,所有家居都能说话

语音交互本身就是很大的一个入口,但是语音交互的入口是不是智能音箱?现在谁也不知道。

在谢殿侠看来,智能音箱在语音交互初期会扮演很大的作用,甚至会成为继电视、手机之后的市场量级很大的一个单品。但是,智能音箱或许不能成为中枢控制设备,去控制其他家电。未来在中国家庭中,应该是去中心化的。

在中国,相比其他家电设备,智能音箱是一个新兴的市场,而电视、冰箱、空调却是一个存量市场。“没准智能语音交互的电视会跑得更快。”谢殿侠称,“未来真正在家庭中起到重要作用的,可能还是电视,另外我还看好智能台灯、儿童故事机等。”

对于智能音箱在智能家居中的地位,谢殿侠认为,智能音箱的本质是机器人的MVP(最小可用功能体)。它可以装入各种机器人和智能家居设备中,可以具备叫起床、查星座、运势、黄历,读取百科、菜谱等诸多功能。谢殿侠说,“过去这些功能可能需要通过好几个APP来搞定,现在只需要一句话的事儿。”

“语音交互机器人是未来的发展方向,未来的语音交互将是Always On(实时在线),家庭中所有的电器都应该具备语音交互能力。”谢殿侠这样憧憬到。

升维,语音交互将重构APP

在谢殿侠看来,智能音箱等语音交互的家居产品只是下一个大时代的冰山一角。

“现在的手机APP与过去PC上的网页和软件有什么区别?主要的区别就是APP进行了升维,这个维度就是诸多的传感器、麦克风以及相机。”谢殿侠说到。

“因为有了GPS传感器,才有了滴滴、Uber、ofo这些公司;这个基础上再加上语音、麦克风,就有了微信、WhatsApp;如果再加上摄像头,就有了Instagram、美图秀秀。”谢殿侠如是说。

根据谢殿侠的观点,当APP升维之后,就产生了PC时代没有的公司和产品。未来有了语音交互之后,就又增加了一个维度,肯定会产生划时代的新产品。

“语音交互增加的是控制维度,这个控制维度并不是语音控制开关灯那么简单。“谢殿侠认为,过去的传感器只是感受,现在又增加了“控制”,将单向交互变为双向,想象力非常巨大,尤其是语义理解起来之后,未来的产品形态会发生翻天覆地的变化。

“比如你跟冰箱说,今天有点累了,它会给你推荐你喜欢吃的而特别有营养的东西。”谢殿侠称,以后所有的业务服务都会升级成skill(技能),这种skill的关键不是它能识别,是它能懂你说的事情,能够像专家一样给你推荐东西。“所以,未来所有的APP都会重构,这种重构可能是把一个单品升级为一个Skill,也可能是过去相互隔离、推崇单点极致的APP思维互相打通。”谢殿侠说到。

巨头略晚,创业稍早

“巨头跟进略晚,自己在这个领域创业稍早。”谢殿侠这样总结自己前三年的创业。

2014年,谢殿侠在美国硅谷碰到自己在北大的同学丁力,当时的谢殿侠一直在做知识管理工作,而丁力则在做语义网(也就是后来的知识图谱),并推出第一款语义搜索引擎。两人在咖啡馆聊天,谈到了当时智能硬件市场的兴起,认为万物互联的时代很快就能到来,而语义理解大展宏图的时机也不远。所以两人一拍即合,回国创业。

“我当时认为,智能硬件的生态能够打通,技术也趋于成熟,所以自己对智能硬件市场有点儿过于乐观。”谢殿侠说到。

一开始,两人开发出了一款智能日历应用,可以识别和理解时间、地点、事件。小试牛刀打通产品技术环节之后,开始按计划做基于语义理解API的开放技术平台。“这个过程中比较艰辛,开始是和机器人、智能音箱厂商合作,但是机器人产业链并没有成熟,市场销量一直很惨淡,而蓝牙音箱的厂商一般说不需要语音交互,他们认为加上手机APP就是智能音箱。”谢殿侠回忆到。

虽然笃定语音交互终将爆发,但是当时巨头公司依然没有介入,随着联网硬件的消退,海知智能也进入了最黑暗的时候。谢殿侠称,那是2016年上半年,我们遇到了很大的一个坎。当时,虽然当时海知为贤二机器僧提供了语义理解技术,在市场上获得了一些知名度,但时机仍未成熟。

“到2016年下半年,情况发生了转变,很多企业开始主动找海知合作。”谢殿侠向网易智能表示,目前海知在语音交互方面已经与海尔、小米等大厂商进行了深度合作,得以将自己储备的语义理解技术快速释放出来。
另外,海知还在to B的跑道上开始布局,从智能客服到招标采购/营销分析等企业智能化上,帮助企业降低成本、提高分析决策的能力。不过在谢殿侠看来,bot+skill平台才是他最终的梦想。

打造bot+skill平台,做语音时代的应用商店

在谢殿侠的规划中,海知智能在做知识图谱,但目的是为了打造各种各样的Skill,比如天气、音乐、影视、饮食、百科等等,把每个领域的数据信息加工通过自然语言理解技术加工成知识图谱,变成机器能够理解的语言。“海知实际上想做的是一个集合众多skill的bot生成平台,帮助移动互联网上的APP变成语音平台上的skill,生成一个个的bot。”谢殿侠说到。

在谢殿侠看来,未来的进化趋势是,APP会变成bot(聊天机器人),而APP上的内容和服务会变成Bot上的Skill。海知将搭建skill技能商店,一方面帮助有数据、内容服务的公司生成skill,另一方面将skill推送给各种各样的bot使用。

“在中国,各种各样的公司都想做自己的语音交互平台,我们作为创业公司,主要是还为大家提供技术服务。”谢殿侠称,我们一方面要吸引更多的开发者甚至是普通人来这里做skill,另一方面要将自己的skill商店导入到各家平台,比如说小米和百度的语音交互平台。据谢殿侠透露,小米智能音箱目前已经配备了海知智能提供的17个skill,后者目前也在参与小米的水滴开放平台。

“一方面我们练好内功,完善我们的bot+skill的工具,让非工程师和开发人员也能使用,将海知的数据整合能力、知识图谱构建、机器学习训练开放出来;另一方面帮助开发者做skill,并且对接给第三方语音平台,为他们导入用户和流量。”谢殿侠准备用这样方式来吸引开发者。

据透露,目前海知的skill开发平台还处于内测阶段,官方的技能插件已经有50多个,还有一小批合作伙伴开发的技能。谢殿侠向网易智能透露,海知的skill平台将在9月底正式对外开放。未来一年,海知这个开放平台开放接入国内外主要bot开放平台,而在海知平台上的技能数量能够突破1万个。

在笔者看来,谢殿侠的规划是让海知成为语音交互时代初期的第三方技能商店,一如智能手机发展初期的苹果应用商店一样。谢殿侠的理由是,语音交互时代初期市场太分散,平台的技能数量整体偏少,和用户开口说话所需要的技能相比缺口巨大,更多的应该是合作而不仅仅是竞争。

“也许三五年之后,平台才会集中,竞争有可能大于合作。”谢殿侠说到。

本文被转载1次

首发媒体 IT思维 | 转发媒体

随意打赏

智能语音助手音箱人工智能语音交互亚马逊语音音箱智能语音音箱语音控制音箱什么是交互交互功能语音音箱人机交互交互设计
提交建议
微信扫一扫,分享给好友吧。