大数据时代的 9 大Key-Value存储数据库

36大数据 • 8年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

大数据时代的 9 大Key-Value存储数据库

Hive知识库在过去的十年中，计算世界已经改变。现在不仅在大公司，甚至一些小公司也积累了TB量级的数据。各种规模的组织开始有了处理大数据的需求，而目前关系型数据库在可缩放方面几乎已经达到极限。

一个解决方案是使用键值(Key-Value)存储数据库，这是一种NoSQL(非关系型数据库)模型，其数据按照键值对的形式进行组织、索引和存储。KV存储非常适合不涉及过多数据关系业务关系的业务数据，同时能有效减少读写磁盘的次数，比SQL数据库存储拥有更好的读写性能。

本文就为你介绍9种用于大数据处理的免费键值存储数据库。 36大数据（http://www.36dsj.com/）

1. Aerospike 社区版

大数据时代的 9 大Key-Value存储数据库

Aerospike是一个以分布式为核心基础，可基于行随机存取内存中索引、数据或SSD存储中数据的数据库。

Aerospike主要用于广告业务，作为一个服务器端的cookie存储来使用，在这种场景下读取和写入性能是至关重要的。

官网： http://www.aerospike.com/press-releases/aerospike-launches-free-community-edition/

相关资料： Documentation 、 FAQ 、 Blog 、 Forums

2. LevelDB

大数据时代的 9 大Key-Value存储数据库

Leveldb是Google开发的一个非常高效的kv数据库，支持billion级别的数据量，在这个数量级别下还有着非常高的性能，主要归功于它的良好的设计，特别是LSM算法。Leveldb已经作为存储引擎被Riak和Kyoto Tycoon所支持，在国内淘宝的Tair开源key-value存储也已经将LevelDB作为其持久化存储引擎，并部署在线上使用。

官网： http://code.google.com/p/leveldb/ 36大数据（http://www.36dsj.com/）

相关资料： Twitter

3. Scalaris

大数据时代的 9 大Key-Value存储数据库

Scalaris 是一个采用Erlang开发的分布式 key-value 存储系统，提供的 API 包括：Java、Python、Ruby和JSON。

官网： http://scalaris.googlecode.com/ 36大数据（http://www.36dsj.com/）

相关资料： FAQ

4. Project Voldemort

大数据时代的 9 大Key-Value存储数据库

Voldemort是一个分布式键值存储系统，是Amazon’s Dynamo的一个开源克隆。特性如下：

支持自动复制数据到多个服务器上。
支持数据自动分割所以每个服务器只包含总数据的一个子集。
提供服务器故障透明处理功能。
支持可拨插的序化支持，以实现复杂的键-值存储，它能够很好的5.集成常用的序化框架如：Protocol Buffers、Thrift、Avro和Java Serialization。
数据项都被标识版本能够在发生故障时尽量保持数据的完整性而不会影响系统的可用性。
每个节点相互独立，互不影响。
支持可插拔的数据放置策略

官网： http://project-voldemort.com/

相关资料： Wiki 、 Github 、 Project Voldemort: Scaling Simple Storage 、 Serving Large-scale Batch Computed Data with Project Voldemort

5. HyperDex

HyperDex是一个分布式、可搜索的键值存储系统，特性如下：

分布式KV存储，系统性能能够随节点数目线性扩展
吞吐和延时都能秒杀现在风头正劲的MonogDB，吞吐甚至强于Redis
使用了hyperspace hashing技术，使得对存储的K-V的任意属性进行查询成为可能

官网： http://hyperdex.org/ 36大数据（http://www.36dsj.com/） 36大数据（http://www.36dsj.com/）

相关资料： Blog 、 GitHub 、 FAQ

6. Berkeley DB

大数据时代的 9 大Key-Value存储数据库

Berkeley DB是一个开源的文件数据库，介于关系数据库与内存数据库之间，使用方式与内存数据库类似，它提供的是一系列直接访问数据库的函数，而不是像关系数据库那样需要网络通讯、SQL解析等步骤。

官网： http://www.oracle.com/technetwork/products/berkeleydb/overview/index.html

相关资料：Wiki、Forums、Launchpad

7. Apache Accumulo

Apache Accumulo 是一个可靠的、可伸缩的、高性能的排序分布式的 Key-Value 存储解决方案，基于单元访问控制以及可定制的服务器端处理。Accumulo使用 Google BigTable 设计思路，基于 Apache Hadoop、Zookeeper 和 Thrift 构建。

官网： http://accumulo.apache.org/

相关资料： Manual 、 Mailing Lists 、 Apache Accumulo Users Group

8. Redis

大数据时代的 9 大Key-Value存储数据库

Redis是一个高性能的key-value存储系统，和Memcached类似，它支持存储的value类型相对更多，包括string(字符串)、list(链表)、set(集合)和zset(有序集合)。与memcached一样，为了保证效率，数据都是缓存在内存中，区别的是Redis会周期性的把更新的数据写入磁盘或者把修改操作写入追加的记录文件，并且在此基础上实现了主从同步。

Redis的出现，很大程度补偿了memcached这类key/value存储的不足，在部分场合可以对关系数据库起到很好的补充作用。它提供了Python、Ruby、Erlang、PHP客户端，使用很方便。

官网： http://redis.io/ 36大数据（http://www.36dsj.com/）

相关资料： Documentation 、 Tutorials 、 FAQ 、 Mailing List 、 Twitter

9. Apache Cassandra

Apache Cassandra是一个混合型的非关系数据库，它最初由Facebook开发，用于储存特别大的数据。

Cassandra的主要特点就是它不是一个数据库，而是由一堆数据库节点共同构成的一个分布式网络服务，对Cassandra 的一个写操作，会被复制到其它节点上去，对Cassandra的读操作，也会被路由到某个节点上面去读取。对于一个Cassandra群集来说，扩展性能是比较简单的事情，只管在群集里面添加节点就可以了。

官网： http://cassandra.apache.org/ 36大数据（http://www.36dsj.com/）

相关资料： Wiki 、 Getting Started

End.

随意打赏

互联网时代大数据时代什么是大数据时代互联网大数据时代大数据数据库非关系型数据库大数据时代

医渡科技徐济铭获聘清华校友总会AI大数据专委会副会长

砍柴网 • 5分钟前

12月18日下午,清华校友总会AI大数据专委会第二届理事会第二次全体会议召开。会上进行了负责人改选和增选理事表决,专委会理事,医渡科技联合创始人、CEO徐济铭获聘副会长。医渡科技联合创始人、CEO徐济铭(右一)获聘副会长据了解,医渡科技与清华合作深入且多元,涵盖围绕联邦学
金仓数据库四项成果入选2024星河案例

砍柴网 • 15小时前

12月18日-19日，由中国通信标准化协会主办的“2024数据资产管理大会”在京召开。为促进数据产业优秀成果推广，会上隆重公布了2024年大数据“星河”案例入围名单，电科金仓携手湖南移动、西京医院、新疆电信、河南移动联合申报的四个实践案例全部入围，分别荣获数据库专项典型案例和潜力案例，成为本届入围案例数量最多
金仓数据库支撑全国首例轨道交通ACC与ITP同步国产化项目上线

砍柴网 • 1天前

近期，电科金仓共同参与建设的合肥市轨道交通自动售检票清分中心系统（ACC）二期及互联网票务平台（ITP）二期项目已正式投入运营。此项目为我国轨道交通领域首次在较短时间内完成线网ACC与ITP同步升级改造，无缝替代ACC一期及ITP一期系统，安全平稳地完成所有既有线路AFC系统的接入，并全面采用国产化
持续领先！中能拾贝在中国电力大数据市场增长率位列第一

砍柴网 • 5天前

国际数据公司（IDC）持续跟踪中国电力行业解决方案市场，近期发布了《中国电力行业大数据解决方案市场份额，2023》（Doc#CHC52422925，2024年11月）报告，深入剖析2023年中国电力行业大数据解决方案市场，并就市场规模、增长速度、主要玩家、市场与技术的发展趋势等内容进行了详
金仓数据库荣获2024年度IT168技术卓越奖

砍柴网 • 8天前

近日，国内知名 IT 垂直媒体 & 技术社区 IT168 发起评选“2024年度技术卓越奖”。经由行业大咖、技术专家等多方联合评审，金仓数据库KingbaseES V9凭借技术创新、性能优化等方面卓越表现，在关系型数据库类荣获“2024年度技术卓越奖”。作为业界风向标式活动
赛迪顾问发布《中国事务型数据库市场研究报告》，海量数据位居前三

砍柴网 • 10天前

近日，赛迪顾问发布《中国事务型数据库市场研究报告》（以下简称：报告），对过去一年国产数据库发展趋势、代表厂商进行总结和分析，并预测了未来中国事务型数据库的发展趋势。报告表示，现阶段，国家对核心领域关键技术的重视已经到了前所未有的高度，以数据库等为代表的基础软件在国家、社会的正常运转中起到了至关重要的作用，其国产化能力与
浪潮KaiwuDB 夺得全球时序数据库性能测试榜单第一名

砍柴网 • 12天前

12月6日，国际权威数据库性能测试平台 benchANT 更新 Time Series: Devops （时序数据库）场景榜单，浪潮KaiwuDB 数据库在时序数据写入吞吐、查询吞吐、查询延迟、成本效益等多个指标下刷新榜单原有数据记录，成功跻身全球时序数据库性能测试榜单首位
VMware替代实战手册：更高效的MySQL数据库迁移方案

砍柴网 • 15天前

数据库作为数字化用户的核心资产,其迁移是一项复杂且重要的任务,特别是在VMware平台替换及IT基础设施更新换代之时,尤其需要保障数据库迁移过程的平稳、流畅。深信服推出的数据库管理平台(DMP)是为关系型数据库量身打造的运维管理解决方案,它整合了数据库日常运维所需的各项功能,包括但不限于数据库的创建、实时监控、数据备份
央视总台新媒体大数据平台实践屡获行业大奖，腾讯云提供全栈技术支持

砍柴网 • 18天前

国家级5G 新媒体平台“央视频”的大数据体系建设实践，已然成为各行各业探索数据驱动业务运营的标杆。近日，中国国际大数据产业博览会公布2024年度“数字中国建设典型案例”，腾讯云与央视总台携手打造的“央视频”大数据平台成为媒体行业唯一入选项目。同时，在前不
金仓数据库管理系统KingbaseES V9新版本发布

砍柴网 • 16天前

技术创新与产品迭代是企业发展的不竭动力。站在大数据时代的风口，作为基础软件行业“皇冠上的明珠”，数据库产品更是如此。金仓数据库管理系统KingbaseES V9最新版本KingbaseES V009R001C002B0014（以下简称“新版本”）于近日正式发布。金仓数据库管理系统KingbaseES是电科金仓自主研发的
核心！金仓数据库助力上海港引航站生产管理系统正式上线

砍柴网 • 16天前

近日，电科金仓携手哪吒港航智慧科技（上海）有限公司，为上海港引航站打造的新一代“i-Pilot智慧引航”综合管理平台的重要组成部分-- 上海港引航站生产管理系统成功上线运行。自项目启动以来，项目团队致力于打造多部门协作，多业务种类，包含外部系统
上海马拉松大数据揭晓：国产品牌特步成为跑者首选

砍柴网 • 19天前

在12月1日落幕的2024上海马拉松中，23000名跑者参与全马。在跑鞋选择上，国产品牌特步领跑，成为最多跑者的选择。据悦跑圈数据显示，上海马拉松全局跑鞋穿着率，特步达22.4%居首位，超过耐克及阿迪两大国际品牌，成为本次赛事的最大赢家。全局穿着率是通过全面统计从精英到大众分时段跑者所穿鞋款，观测跑者对跑鞋品牌的认可度
矩阵起源入选IDC《RAG与向量数据库市场前景预测》报告

砍柴网 • 22天前

近日，国际知名市场研究机构IDC发布了《RAG与向量数据库市场前景预测》报告，分析了检索增强生成（RAG）和向量数据库市场的发展趋势和技术走向。报告中提到，生成式AI的大规模应用使向量数据库成为重要的基础设施，满足企业在知识管理、内容生成和智能搜索等方面的需求。在该报告中，矩阵起源作为国内向量数据库市场的代表厂商之一，
大数据物流先锋：跨越速运如何通过技术强化企业物流体验

砍柴网 • 25天前

作为国内限时速运市场的专家，跨越速运在响应客户需求方面的反应能力更高，在这背后，则得益于先进的大数据技术支撑。众所周知，跨越速运是一家披着科技 “外衣”的物流公司，而大数据技术的应用进一步提升了跨越速运在决策方面的能力。通过对海量物流数据的深入分析，跨越速运能够准确洞察市场的发展趋势，从而优
时序数据库IoTDB支撑北斗智慧物联五大应用平台智慧城市建设

砍柴网 • 23天前

1. 业务场景介绍1.1 公司简介四川北斗智慧物联科技有限公司（以下简称北斗智慧物联）专注于北斗定位、物联网、大数据、5G 等技术的融合应用，致力于提升智慧城市的数据价值。为政府和企业用户提供导航定位、高精度差分定位和基于位置的增值信息服务等一体化系统解决方案。其业务涵
DolphinDB 参与起草的首个大数据批流融合国家标准正式发布！

砍柴网 • 27天前

目前，金融交易监控、交易物流、电商推荐等场景对大规模实时数据处理的需求持续增长。在批量计算范式难以满足低时延需求的背景下，将流式计算与批量计算融合于统一技术框架已成为行业发展的必然选择。为规范和引领批流融合技术的发展，国家市场监督管理总局、国家标准化管理委员会于今年 7
四部门：严禁利用算法实施大数据“杀熟

i黑马 • 29天前

11月24日，中央网络安全和信息化委员会办公室秘书局、工业和信息化部办公厅、公安部办公厅、国家市场监督管理总局办公厅联合发布《关于开展“清朗·网络平台算法典型问题治理”专项行动的通知》。决定自即日起至2025年2月14日开展“清朗·网络平台算法典型问题治理”专项行动。主要任务：1.深入整治“信息茧房”、诱导沉迷问题。构
贵阳市大数据发展管理局举办贵阳贵安数字经济发展专题讲座

数据观 • 1月前

为深入学习贯彻习近平总书记对贵州“在实施数字经济战略上抢新机”的重要指示精神，推动党的二十届三中全会精神在贵阳贵安大数据领域落地落实，提升贵阳贵安领导干部纵深推进“数字活市”战略的能力和水平，11月16日上午，贵阳市大数据局举办了贵阳贵安数字经济发展专题讲座，邀请国务院特殊津贴专家、国家数据标准化委员会数据基础设施工作
2024金砖大赛大数据分析应用与决策赛项全国总决赛落幕

砍柴网 • 1月前

11月10日，2024一带一路暨金砖国家技能发展与技术创新大赛大数据分析应用与决策赛项全国总决赛成功落幕。341支本科、高职、中职参赛队伍经过两轮比拼，天津仁爱学院、苏州大学、湖南财政经济学院等（本科组），湖州职业技术学院、浙江旅游职业学院、广东科学技术职业学院等（高职组），胶州市职业教育
小红书将业界最大数据湖迁至阿里云

i黑马 • 1月前

11月6日，经过一年奋战，小红书已把业界体量最大的数据湖0故障迁上阿里云。据统计，该项目共有1500人参与，迁移数据500PB。据了解，小红书的数据湖存储了过去11年的所有原始数据，包括结构化、半结构化和非结构化数据。随着业务的高速增长，其在线处理数据的需求不断增加，为此去年11月，小红书发起迁云项目。文章评价匿名用户

评论