Google发布交互式信息图:搜索引擎是怎样工作的?

雷锋网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

how 每一个人都好奇 Google 搜索 是怎样工作的,是怎样从一个页面爬行到另一个页面的,当人们搜索时怎样排列这些结果的。所以 Google 用一个全新的方式呈现了这个答案,看看下面的 交互式图表 ,详细解释了搜索过程,包括Google是如何处理垃圾邮件的。

Google去年发布了一个互动图谱( The Story Of Send )解释如何处理邮件的。

Google搜索的产品经理Jake H Uber t表示“我们看着这个网址(The Story Of Send),Matt Cutts [Google首席Web垃圾信息斗士] 和我以及其它人开始思考,搜索是不是也可以用类似的活动幻灯片展示出来呢?” 是的,可以,所以才有了How Search Works幻灯片的由来。

主要为3个部分:

一. 爬行&索引
Google爬行网页后之后就会储存使它能被 搜索到 (这些信息像本虚拟的大图书,被称为索引), 总的索引源来自几方面:文本索引库(虚拟的大图书);Google街景(确保搜索时能顾及到现实世界的结果);知识图谱(更好地组织来自人、地点、世界的信息;提供更好的答案)

当你探索到这些字眼的时候,就会有相关链接和隐藏的“复活蛋”,你会发现它透漏着更多信息,就像你拿着鼠标浏览点击的过程。

craw

比如搜索string theory

seach

Google就会迅速在后台寻找与string theory相关的信息:

 

st story

 

二. 依据算法进行网页排名

搜索出来的页面排名全是依据Google算法的,有超过200种排名机制来决定什么应该出现。

比如会根据你搜的发音、自动匹配、同义词、搜索方法、查询了解方向来决定显示结果。网页排名会依据网页品质、新鲜度、安全搜索性、用户内容、可翻译性以及搜索最多的关键字,最后决定显示结果。

algorithms

三. 反垃圾

大部分发垃圾行为都是自动的,然后有些问题文件会手动检查,一旦发现,手动清除。一般你看不到活生生的垃圾被清理的画面,但是一般在声明被取消的1小时内就会移走。

part-3

下面是手动清除的反馈图,都清除些什么东西?

actions-over-time

很感谢Google的这个举动,因为很多人都没法弄明白到底Google是怎么工作的,这个 幻灯片 点进去的时候,鼠标移到哪里,就会有相应文字说明,非常直观生动。

Via  searchengineland      附幻灯片 链接

相关:

搜索引擎的大数据时代

 

随意打赏

提交建议
微信扫一扫,分享给好友吧。