专访谢殿侠:别只盯着智能音箱 语音交互将重构 APP
“ 智能音箱 终于火起来了。”
见到谢殿侠,他正坐在北京一个临时的办公室中,第一句话脱口而出。
从上海到北京,谢殿侠创立的海知智能已经历了三年的时间。作为专注中文语义理解的创业公司,海知智能体量不大,但机会风暴正在袭来。
智能音箱,在中国事儿有多大
亚马逊Echo的火热已经蔓延到了中国。在看到了语音交互的发展前景之后,中国科技企业,不管是巨头公司,还是创业机构,亦或是传统制造厂商,都开始进入智能音箱领域。
但一个悲催的事实是,智能音箱在美国已经具备了年销量千万级的市场,在中国这一数字目前不到百万。
差距为何如此之大?在谢殿侠看来,中国智能音箱市场起步速度不会很快,成熟度也不会那么高,这是因为智能音箱在中国家庭中扮演的角色远没有美国重要。
谢殿侠认为,相比之下,中国没有形成家庭主妇的社交群体,晚上又因为应酬较多不在家,而中国家庭一般没有开放式厨房,大多数的习惯是看电视。这几点原因导致中国音箱用户少,使用场景、时间段都被压缩。
“所以,即使中国厂商可以把智能音箱做得比Echo更漂亮、更便宜,内容服务也更好,但是纯粹作为单品音箱来讲,其成功的程度和速度都不及美国。”谢殿侠说到。
有业内人士认为,目前投放到智能音箱上的“热钱”都已经砸进来了,初期的市场规模一定会起来。“我认为中国智能音箱市场明年销量能达到千万台的级别”,谢殿侠认为,像小米将价格打到299元,其实是想切传统蓝牙音箱的蛋糕,如果能将这部分存量市场进行转化也是不错的。
“但中国智能音箱的活跃度、黏性、留存率未必有美国市场那么高。”谢殿侠补充到。
去中心化,所有家居都能说话
语音交互本身就是很大的一个入口,但是语音交互的入口是不是智能音箱?现在谁也不知道。
在谢殿侠看来,智能音箱在语音交互初期会扮演很大的作用,甚至会成为继电视、手机之后的市场量级很大的一个单品。但是,智能音箱或许不能成为中枢控制设备,去控制其他家电。未来在中国家庭中,应该是去中心化的。
在中国,相比其他家电设备,智能音箱是一个新兴的市场,而电视、冰箱、空调却是一个存量市场。“没准智能语音交互的电视会跑得更快。”谢殿侠称,“未来真正在家庭中起到重要作用的,可能还是电视,另外我还看好智能台灯、儿童故事机等。”
“语音交互机器人是未来的发展方向,未来的语音交互将是Always On(实时在线),家庭中所有的电器都应该具备语音交互能力。”谢殿侠这样憧憬到。
升维,语音交互将重构APP
在谢殿侠看来,智能音箱等语音交互的家居产品只是下一个大时代的冰山一角。
“现在的手机APP与过去PC上的网页和软件有什么区别?主要的区别就是APP进行了升维,这个维度就是诸多的传感器、麦克风以及相机。”谢殿侠说到。
“因为有了GPS传感器,才有了滴滴、Uber、ofo这些公司;这个基础上再加上语音、麦克风,就有了微信、WhatsApp;如果再加上摄像头,就有了Instagram、美图秀秀。”谢殿侠如是说。
根据谢殿侠的观点,当APP升维之后,就产生了PC时代没有的公司和产品。未来有了语音交互之后,就又增加了一个维度,肯定会产生划时代的新产品。
“比如你跟冰箱说,今天有点累了,它会给你推荐你喜欢吃的而特别有营养的东西。”谢殿侠称,以后所有的业务服务都会升级成skill(技能),这种skill的关键不是它能识别,是它能懂你说的事情,能够像专家一样给你推荐东西。“所以,未来所有的APP都会重构,这种重构可能是把一个单品升级为一个Skill,也可能是过去相互隔离、推崇单点极致的APP思维互相打通。”谢殿侠说到。
巨头略晚,创业稍早
“巨头跟进略晚,自己在这个领域创业稍早。”谢殿侠这样总结自己前三年的创业。
2014年,谢殿侠在美国硅谷碰到自己在北大的同学丁力,当时的谢殿侠一直在做知识管理工作,而丁力则在做语义网(也就是后来的知识图谱),并推出第一款语义搜索引擎。两人在咖啡馆聊天,谈到了当时智能硬件市场的兴起,认为万物互联的时代很快就能到来,而语义理解大展宏图的时机也不远。所以两人一拍即合,回国创业。
“我当时认为,智能硬件的生态能够打通,技术也趋于成熟,所以自己对智能硬件市场有点儿过于乐观。”谢殿侠说到。
一开始,两人开发出了一款智能日历应用,可以识别和理解时间、地点、事件。小试牛刀打通产品技术环节之后,开始按计划做基于语义理解API的开放技术平台。“这个过程中比较艰辛,开始是和机器人、智能音箱厂商合作,但是机器人产业链并没有成熟,市场销量一直很惨淡,而蓝牙音箱的厂商一般说不需要语音交互,他们认为加上手机APP就是智能音箱。”谢殿侠回忆到。
虽然笃定语音交互终将爆发,但是当时巨头公司依然没有介入,随着联网硬件的消退,海知智能也进入了最黑暗的时候。谢殿侠称,那是2016年上半年,我们遇到了很大的一个坎。当时,虽然当时海知为贤二机器僧提供了语义理解技术,在市场上获得了一些知名度,但时机仍未成熟。
打造bot+skill平台,做语音时代的应用商店
在谢殿侠的规划中,海知智能在做知识图谱,但目的是为了打造各种各样的Skill,比如天气、音乐、影视、饮食、百科等等,把每个领域的数据信息加工通过自然语言理解技术加工成知识图谱,变成机器能够理解的语言。“海知实际上想做的是一个集合众多skill的bot生成平台,帮助移动互联网上的APP变成语音平台上的skill,生成一个个的bot。”谢殿侠说到。
在谢殿侠看来,未来的进化趋势是,APP会变成bot(聊天机器人),而APP上的内容和服务会变成Bot上的Skill。海知将搭建skill技能商店,一方面帮助有数据、内容服务的公司生成skill,另一方面将skill推送给各种各样的bot使用。
“在中国,各种各样的公司都想做自己的语音交互平台,我们作为创业公司,主要是还为大家提供技术服务。”谢殿侠称,我们一方面要吸引更多的开发者甚至是普通人来这里做skill,另一方面要将自己的skill商店导入到各家平台,比如说小米和百度的语音交互平台。据谢殿侠透露,小米智能音箱目前已经配备了海知智能提供的17个skill,后者目前也在参与小米的水滴开放平台。
据透露,目前海知的skill开发平台还处于内测阶段,官方的技能插件已经有50多个,还有一小批合作伙伴开发的技能。谢殿侠向网易智能透露,海知的skill平台将在9月底正式对外开放。未来一年,海知这个开放平台开放接入国内外主要bot开放平台,而在海知平台上的技能数量能够突破1万个。
在笔者看来,谢殿侠的规划是让海知成为语音交互时代初期的第三方技能商店,一如智能手机发展初期的苹果应用商店一样。谢殿侠的理由是,语音交互时代初期市场太分散,平台的技能数量整体偏少,和用户开口说话所需要的技能相比缺口巨大,更多的应该是合作而不仅仅是竞争。
“也许三五年之后,平台才会集中,竞争有可能大于合作。”谢殿侠说到。