透过现象看本质 揭秘迅雷离线下载平台
第1页:迅雷离线下载平台的工作原理
下载是很多人都会用到的功能,在前面的《热点资源下载慢 是迅雷限制还是误读?》文章中,我们详细的介绍了迅雷离线下载是如何为用户提供优质资源高速下载的原理。而作为一名存储编辑,只剖析离线下载的原理显然是不够的,这篇文章将从存储的角度对迅雷离线下载存储平台进行一些解析。
作为迅雷这么大的机房,其保密措施还是非常完善的,所以即使费了九牛二虎之力,笔者获取的机房资料仍是寥寥。所以这篇文章更多的是笔者基于迅雷离线下载的透露出的一些资料进行的推测,可能会跟具体情况略有不同,但相信对于企业机房建设还是有一定的参考意见的。
要分析迅雷离线下载的平台,首先我们需要先了解下离线下载平台的工作原理。迅雷离线下载平台的工作原理可以分为四个步骤,下面我尽量用通俗的语言跟大家讲解一下:
第一步,用户通过迅雷的客户端或Web页面向服务器提交一个下载的请求。
第二步,迅雷服务器在接受用户请求的时候,首先查询用户提交的下载文件是否被下载过。如果有,寻列会直接将已下载的文件(或链接)放入到用户端的离线下载文件夹中。如果没有,迅雷就会开启多线程实施下载(或用P2P方式)。
第三步,下载完成后,用户需要登录离线文件夹,将文件下载到本地文件夹中。期间可以采用迅雷提供的P2P方式,从已下载或正在下载的相同文件的用户那里取得数据。
离线下载业务多针对冷门资源,或资源较少的文件,相比直接下载,增加了下载资源速度,节约了时间。从上面的三个步骤我们可以推测出离线下载服务器需要三个服务器平台支持,分别为用来接受客户端或Web端请求的Web服务器,用来提供下载的离线下载服务器和用来存储数据的数据存储服务器。
目前迅雷拥有400万用户,那么三个服务器如何能够满足要求呢?这三个平台虽然面向不同的服务,但其实挑战最大的是来自存储端,在服务器和内存方面的挑战要小很多,那么接下来我们就来看一下什么样的存储平台才能满足用户要求呢?