从信息到理解:越过搜索看智能语音Siri的未来演绎
Siri一直被视为苹果语音搜索的未来,同时也被视为Google搜索的潜在竞争者。而在最近,Siri的缔造者SRI公司除了打造
\n银行助手Lola外,还正打造旅游业的语音助手Desti。那么Siri的未来会向哪些方向发展呢?我们来看看Desti的创始人兼CEO
\nNadav Gur的观点:
\n阿尔伯特·爱因斯坦曾说过:“傻瓜都知道,但重点是要去了解!”
\n
自去年Siri 在iPhone 4S上发布以来,媒体上就充斥着对其未来的预测:Google的Eric Schmidt 评论称Siri对Google形成巨大的威胁,也有许多VC和意见领袖发表了数不清的文章。
人工智能时代是否已经到来?从旅游业到金融业,它能否在更多的行业里应用?我们是要面对一个接一个的Siri 克隆品,还是这个类目能够继续进化?
在设置提醒方面,Siri 表现优异。但她是否只是这个智能手机基本功能的更好前端而已呢?此文讲的是我们如何从利用电脑管理信息,转变成管理知识。
知识 = 信息 + 含义
你可能“知道”外面气温为38度,但如果你不懂得38度意味着炎热,那38度这个信息就毫无用处。
要想理解“38度”这个概念,你必须得知道38度的含义以及热的概念。它们混杂起来又被称作是领域知识(domain knowledge),它允许你为信息赋予含义。这样,知识就能为你带来价值,帮你更好地决策。今天出门就不必穿着羊绒衫了。
知识与理解分不开,用户可以更好地决策。更好的决策意味着更少出错,效率也会因此提高。
更佳的搜索来自理解
专注于含义是语义学和语义搜索的基石所在,最终搜索的是概念,而不是关键字。
在过去10来年间,搜索引擎基本上就是把关键词与文件相匹配而得出搜索结果,对此我们习以为常。我们会收到一大堆链接的页面,里面含有我们输入的关键词的一些变换。接着我们就得人工在繁杂的列表里搜寻,以期能找到合适的结果。
无疑,这样的工作量不会小。而语义搜索引擎却能试图理解我们找的是什么,然后再检索到最佳的结果,无论我们所用的特定字词是否被提及。这种办法最吸引人的地方在于,通过理解我们的意图,我们就能获得相关度更高的,同时也更准确的结果。
这个过程首先是要理解用户要的是什么,然后还要理解特定页面上所讨论的内容为何。通过语音到文本,Siri 在字面上理解你 上面有了不错的进展,但更重要的是,她还得从用户所说的话当中提取含义。
最理想的情况是,Siri 一方面能理解人们的需求,另一方面也能理解互联网上数十亿个页面的含义。除了“组织全世界的信息外”,你还得组织全世界的知识(提醒:知识=信息+含义)。理解人们在说什么或者在问什么并且将其转化为实用的意义,是从分散在网络上的Billion级信息中进行整理的第一步。
无论是通过关键词还是利用滑条、目录或者小插件来进行的搜索索引,信息交互的这些传统做法都不能将其切断。要真正释放搜索的能量就必须使用自然语言:通过声音到文字或者直接通过文字到文字。利用这种新的搜索模式,我们将可以把隐藏在非结构化数据背后的价值释放出来,并且提供更好的结果。
这也就是为什么自然语言的前端Siri是Google实实在在的一个威胁,或者说是对其基于关键字搜索的一个威胁。Google对此比任何人都清楚,而Google最近宣布推出的语义搜索就是对其的直接回应。
个人虚拟助手(VPA)的崛起
眼下最急的事情在于帮助系统开发领域专业知识(domain expertise),而这并非易事。即使对于最聪明的人来说,领域知识都一个需要长时间的积累才能取得的,就算如此也没有人能成为所有方面的专家。
而这是推进我们从目前的关键词搜索向未来个人虚拟助理演进的核心。作为开发了Siri的SRI显然明白个人虚拟助手将真正有用,他们需要专注于某个特殊领域的知识。事实上,SRI已经开发了相关核心技术并开始系统的运用到某些特定领域,如最近为银行业推出了虚拟个人助手
\nLola。
同样在旅游这个特殊领域,我们(
\nDesti)正在打造一个能理解旅客意图并能直接提供相关答案和行动的可信顾问,而所有的一切将专为个人定制。根据Google提供的数据,在预定旅游之前,用户平均会访问22个网站。制定旅行计划其实可以不用那么的沮丧和费时。
如果制定旅行计划就像与你即将访问之地的朋友进行交流互动那样简单就好了,这样的朋友可以在当地纷乱的环境下给予你推荐,并且还知道你喜欢什么。将Siri的概念运用到一些特殊垂直领域是非常值得参考的一种努力,而每一个领域都有其独特的语言、知识以及推理。
相比于让一个助手了解所有的东西面对所有人,我们只需让一个虚拟助手成为银行的出纳(Lola),一个成为益智游戏助手,而另外的可以成为旅行伴侣。
这显然是一个非常困难的挑战,但是这样的产品正在变成现实。
总结
我们都希望拥有一个能利用我们的过去来指导我们现在行为的个人虚拟助手(VPA),它拥有很深的领域知识。软件确实能在我们最需要的时候为我们提供真实并专业的指导。我们现在正在见证的,是在不同方法层面的根本变化。而在不久的将来我们可能会有如下变化:
*管理信息 => 管理知识
*匹配关键字 => 匹配概念
*“搜索”服务 => “操作性意图”服务
\n最终,人们想要的其实是被理解。这往往开始于一个对话,而当对话产生真正的关系:一个基于相互尊重、共同的语言、并有一定亲切感的关系。