几大互联网公司的数据库访问层架构概览

鸡啄米 • 12年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

&　　在web开发中，数据库的数据读写和传输一向是瓶颈，在此基础上的解决方案基本都是数据库连接层的设计，一个公司数据库连接层的牛b与否可以标识这个公司的全局规划的“工艺水平”到达一个什么样了。下面的内容来自明查暗访，决无bs之意，旨在提供给需要统一规划整体架构的架构师一个帮助。&

　　1、百度

　　参考：http://wenku.baidu.com/view/9daa2b8102d276a200292e9c.html

　　关键词：dbproxy，服务器都是flash卡，dba与开发者都不关心分裤分表（半自动）

　　百度的dbproxy利器，将mysql的管理半自动化，ha等功能一应俱全，再加上ssd等硬件支持，性能相当不一般。dbproxy的作用是合理地分配数据库请求给所有的dbserver，使得在请求的数量等于或者小于所有dbserver的计算能力总和时，服务能够正常运行。

　　第一种方式的dbproxy:webserver上的数据库客户端(如php脚本)拥有选择dbserver的智能。

　　这种方式实现简单，完全用web脚本实现，脚本自己判断应该连接其中的一台或者几台dbserver，请决定把sql请求发给谁。这种方式因为性能问题,所以应用不是很广。

　　第二种方式的dbproxy:sql代理进程

　　类似http代理服务器，这种方式的dbproxy独立运行，所以客户端请求将不再直接和dbserver连接，而是通过它中转。这样的dbproxy，首先要拥有解析协议(也即sql)的能力，这也带来一个特点，dbproxy可以与后端的mysql连接，但却接收前端(如php脚本)发来的oracle数据库的sql请求。

　　当然，dbproxy的主要功能还是在sql分发方面。另外,还可以在dbproxy上面做与业务更接近的缓存，相比数据库的底层缓存很多时候更有效。&

　　2、腾讯

　　参考：腾讯大讲堂45-解剖ttc

　　关键词：tencenttablecache

　　ttc是提供高速数据访问服务的通用cacheserver。特点是采用epoll和异步状态机模式提高并发能力。ttc看上去是一个数据库缓冲层，由于资料有限，只能如此分析。

　　3、淘宝、支付宝

　　参考：http://wenku.baidu.com/view/f36d620c844769eae009edba.html

　　关键词：jboss作为中间件，有数据路由层，数据库oracle与mysql

　　在网络上许多文档里都有提到阿里内部是有一数据路由层的，另外jboss的使用也使得他们轻便不少（可惜当年哥在淘宝时只搞的是搜索，不使用db）

　　目前淘宝和支付宝使用的oracle数据库为oracle11g。借助oracle11g新增的pl/sql相关的某些新特性如网络日志分析工具，为客户和内部技术人员带来了更加快速简便的全新体验;利用oracleadvancedcompression技术，不仅节省大量存储空间，而且提升了查询性能。

　　4、新浪

　　参考：网友

　　关键词：无中间件分表要开发者自己做

　　5、人人网

　　参考：http://ugc.renren.com/2009/12/28/renren-ice-problem/

　　关键词：ice中间层，统一配置数据源，开发者不关心分库分表

　　与很多大型的网站一样，人人网的系统全部是由开源软件构建的。使用nginx做前端接入，resin做容器，memcached做通用cache，mysql做数据库，使用linux操作系统。

　　除了上述的部分外，人人网还有一个与众不同的中间层。中间层以服务的形式存在，位于mysql和resin中间，提供高并发低成本的数据访问层。

　　人人网的技术高级总监黄晶曾提到“我们的数据库用到了部分自身缓存机制，比如尽可能利用innodb的pool和mysql的querycache。在中间用到memcached，以及基于ice通讯框架由我们自己编写的包含业务逻辑处理能力的缓存服务，在我们自行开发的分布式kv系统中也会充分利用内存cache加速。”

　　6、盛大-技术保障中心

　　参考：网友

　　关键词：无中间件，每个系统一个数据库，开发者严重关心分库分表

　　7、金山

　　参考：网友

　　关键词：无中间件分表要开发者自己做

　　延伸阅读

　　豆瓣网：beansdb与nosql的应用与发展

　　beansdb主要由server端和client端两个部分组成。server端用c编写，使用memcached的通讯协议，任何支持memcached的client端都可以与beansdb的server端同步来获取和存储数据。在client端方面的主要差别是分布式的逻辑实现方面。目前，beansdb的client端主要是豆瓣自己用python语言的实现。client端的运作方式是写数据时写入多份，读的时候只读一份，用其他任何语言实现也和简单。

　　beansdb开放在googlecode上，在采访中，洪强宁先生谈到，豆瓣开放beansdb，希望能看到其他语言的client端实现，让这个beansdb的使用更加方便，能让更多人用到这个产品。

　　目前，beansdb在豆瓣主要部署了两个集群：一个集群用于存储数据库中的大文本数据，比如日记、帖子一类；另外一个豆瓣fs集群，主要用于存储媒体文件，比如用户上传的图片、豆瓣电台上的音乐等。

除非特别注明，鸡啄米文章均为原创

转载请标明本文地址：http://www.jizhuomi.com/software/316.html

2013-4-9 15:48:42

作者:鸡啄米分类:软件开发浏览: 评论:1