Google是如何做移动搜索的(一)
长久以来Google的旗舰产品已成为我们生活的一部分。但Google并不认为搜索理所当然就应该是那样的。此文编译自《In The Plex : How Google thinks, Works, and Shapes Our Lives》作者Steven Levy的
文章
,是有关搜索变革研究的第一部分。
天为什么是蓝的?
小孩经常问这个问题,但是很少有家长在不需要帮助的情况下能回答得上。不久以前,找到正确的答案至少需要钻研百科全书,甚至还需要跑一趟图书馆。不过最近,爸爸妈妈只需要打开电脑,Google一下,点击链接,问题的回答就呈现在面前,然后父母阅读一下解释,再用小孩可以理解的方式阐述一遍即可。
但到了2015,甚至这种看似快捷的过程也算不上快了。首先,在移动设备上问题的提出更有可能是通过口述而不是在搜索框敲字。其次,尽管从一堆链接排序中选择最相关者仍然是特定查询的有效办法,那些有着明确定义问题(如天空为什么是蓝的)的人更希望马上知道答案。如果Google不能马上提供答案,这些人就会失望、甚至愤怒。
那么……“好吧,Google……为什么天是蓝的?”
对于Google最近几年对搜索进行的变革,Google搜索团队负责人Amit Singhal以飞机空中更换引擎来打比方,其改动包括排名算法,添加新的企业信息,以及在用户完成问题输入前开始搜索等。除了引擎切换以外,在移动搜索即将超越桌面搜索的大背景下,Google也在考虑对“座舱”—使用界面进行彻底的重新设计,甚至考虑整个使命的重新定位。
搜索一直是公司的旗舰产品,搜索广告仍是公司的主要收入来源,Google对搜索的重视跟外界对Google的关注点是不一样的。现在开始有人质疑Google搜索在走下坡路(参见 Google统治终结了吗 )。理由包括:1)垃圾结果太多 2)过分强调信息的更新度而非相关性等。Singhal强烈抨击这种言论,认为说法与事实完全相反,Google的搜索做得比2年前好得多,那些批评者陷入的是一股对过去的怀旧情绪。
尽管如此,Facebook的社交网络屏蔽Google的爬虫抓取信息令Singhal感到忧心忡忡,担心封闭的网络会威胁到Google的地位。但事实证明他过过虑了。Facebook的Graph Search仍非常稚嫩,对Google几乎没什么影响。微软的Bing在搜索质量上有得一比,但市场份额不到1/5。在基础设施、人才厚度、经验、雄心等方面没有竞争对手可以与Google匹敌。G+尽管远未能成为引起轰动的社交网络,但的确吸引了许多搜索用户的加入。
要说到威胁,Google搜索最大的威胁并不是来自于竞争对手,而是搜索对象的变化—从web迁移到了星罗密布的app孤岛。不过Google认为这种情况自己是可以克服的—毕竟开发者跟网站站长一样希望自己的信息被发现。从2013年秋,Google开始设立App Indexing将移动app内的数据纳入整个索引内。现在已经有15%的Android登录用户可获得含app内信息的搜索结果。但是iOS app是一个很大的坑。
目前抓取app信息的挑战尚未影响Google的搜索统治地位。Google每天接受的搜索查询超过30亿次, 每年执行的搜索超1万亿次 。美国2/3的搜索用的是Google,在全球其他地区(中国除外)情况类似。最近Google搜索份额的变化只是因为 Yahoo跟Firefox的默认搜索引擎交易 导致的。而且Google还拿到了80%的移动搜索份额。2013年Google出现了5分钟的中断的结果是全球流量下挫了40%!
尽管搜索不是外界关注Google的热点,但它本身却正在进行稳步而密集的再造。实际上17年的时间里Google从未停止对搜索的改进,但最近几年Google搜索变革的速度明显加快,为的是保持领先优势。
其中的一些变化用户已经有所体会。搜索更快了、内容更新了、更加社会化了、结果呈现更加丰富了。这些变化不是一夜之间完成的,而是Google持续不断的升级改进的结果。Google每周都要开搜索质量协调会,对算法进行微调。每2、3年都要对排名系统进行重大升级,最近一次的代号为Hummingbird。据称过去3年排名系统进行的改动要比此前13年的加起来还要多。
Google搜索的变革主要体现在三个方面:知识图、语音搜索和Google Now。知识图把全球的信息组织为一个浩瀚的数据库;语音搜索把口语吸收进了搜索;而Google Now则提供了未问先答的能力。这三大变化都与Google聚焦于移动有关。
知识图 (Knowledge Graph)
知识图谱的推出源自对MetaWeb的收购。MetaWeb 2005年由知名计算机科学家与创业者Danny Hillis创办,2007年推出。做的是 语义网 。MetaWeb做的事情也是通过扫描互联网去回答问题,它拥有1200条人、地点与事物的实体记录,一度被认为是Google的竞争对手。不过最终Hillis意识到只有在Google的大树下自己搭建全球信息数据库的宏伟目标才能实现。而彼时尽管Google也提供了一些问题(比方说奥巴马生日)的直接答案,但是却无法回答“西海岸学费低于3万美元的大学”、“至少获得过一次奥斯卡奖的年龄超过40的演员”这样的问题。双方一拍即合。
Google意识到,事物是搜索的重要部分,而让大众关心的事物的事实与信息迅速呈现是一种很好的方式。于是在MetaWeb的基础上,2012年5月,Google推出了提供搜索主体关键事实的 知识图 作为搜索的辅助呈现在搜索结果页面的右侧。现在它的条目已经超过了5亿。那么那些搜索结果会出现知识图呢?Google会将查询词条扩展为其他形式和同义词等等,然后进行算法测试看看是否与知识图(Knowledge Graph)结果相关,确定相关后再从中择取相关结果呈现(比方说敲“达芬奇”试试)。根据估计,目前约有25%的搜索可唤出知识图。
在Google搜索与知识图整合的这2年多的时间里,知识图也在不断演变。原先它是静态的,但现在正慢慢吸纳Google搜索本身在分析用户行为方面的学习能力。比方说“谁在《太空炮弹》中饰演Barf?”这样的问题问多了以后,知识图就知道要把演员、电影和情节等东西列进去。
此外在知识的新鲜度方面知识图也有了大幅改进。以往知识的更新最长可能需要2个星期。但现在系统已经能处理新闻,所以更新调整只需要几分钟。
当然,Google的改进计划还有很多。包括增加知识域(最近添加了汽车、视频游戏、雨果文学奖得主),提供除简单事实以外更加复杂的、更主观性、模糊化的搜索结果。用户的兴趣点就是改进的出发点。而Google最终想要实现的效果是,让你不仅觉得跟你对话的不是冰冷的机器,而是既无所不知又懂附庸风雅的圣人。
但这个目标目前还有点遥远。令产品经理Emily Moxley恼火的是,尽管现在知识图已经知道一些电视节目,但却既缺乏新剧集的信息,也不知道什么时候上映,在哪里能够看到。在知识图成为圣人之前,Google需要要先实现这一“中期目标”。
或者这个要求还有点高。因为4年时间过去了,Google至今仍未给出上述那两个类似问题(“西海岸学费低于3万美元的大学”、“至少获得过一次奥斯卡奖的年龄超过40的演员”)的一站式的答案。知识图,任重而道远啊。
未完待续......
[本文编译自: medium.com ]