hadoop 生态

本页是关于频道"hadoop 生态"的所有博文，按照时间倒序展现。实时更新。

总数 10 第 1/1 页

Hadoop 生态圈危机四伏，如何应对大数据基础平台的安全威胁

雷锋网 • 7年前

当前，以 Hadoop 为基础的大数据开源生态圈应用非常广泛。国内 Hadoop 已经广泛应用于金融、电信、制造、能源以及医疗健康领域，而这些领域每天都有数以亿计的数据产生，对于大数据资产的存储、挖掘、分析等流程都会涉及到用户信息安全。因此，如何构建一个开源、稳定、高性能而又安全可靠的大数据管理平台是当务之急。本期硬创

一步一步学习大数据：Hadoop 生态系统与场景-36大数据

36大数据 • 7年前

作者：LeeHadoop概要到底是业务推动了技术的发展，还是技术推动了业务的发展，这个话题放在什么时候都会惹来一些争议。随着互联网以及物联网的蓬勃发展，我们进入了大数据时代。IDC预测，到2020年,全球会有44ZB的数据量。传统存储和技术架构无法满足需求。在2013年出版的《大数据时代》

比较Apache Hadoop 生态系统中不同的文件格式和存储引擎的性能

36大数据 • 7年前

主题这篇文章提出了在Apache Hadoop 生态系统中对比一些当前流行的数据格式和可用的存储引擎的性能：Apache Avro, Apache Parquet, Apache HBase 和 Apache Kudu 空间效率，提取性能，分析扫描以及随机数据查找等领域。这有助于理解它们中的每一个如何(何时)改善你

hadoop生态系统的详细介绍

36大数据 • 8年前

1、Hadoop生态系统概况Hadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。Hadoop的核心是HDFS和MapReduce，hadoop2.0还包括YARN。下图为hadoop的生态系统：2、HDFS（Hadoop分布式文件系统）源自于Google的GFS论文，发表于2003年

不同文件格式和存储引擎在Apache Hadoop生态系统中的性能比较

36大数据 • 8年前

作者 | Zbigniew Baranowski ZBigniew Baranowski是一位数据库系统专家，并且是提供和支持中央数据库和基于Hadoop服务的CERN（欧洲核子研究组织）的成员。此博客最初发表在CERN的“CERN数据库”博客上，其转发已获得CERN的许可。网址：http://blog.clo

Docker生态会重蹈Hadoop的覆辙吗?

36大数据 • 8年前

一、Docker的兴起和Hadoop何其相似2015年说是Docker之年不为过，Docker热度高涨，IT从业人员要是说自己不知道Docker都不好意说自己是做IT的。2016年开始容器管理、集群调度成为热点，K8s开始成为热点。但这一幕和2013年的Hadoop大数据何其相似，当年你要说自己不知道大数据，或是知道

电商平台实战经验：电商中的Hadoop生态系统应用

数据观 • 8年前

导读：我们都知道Hadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。而如何将Hadoop生态系统应用到电商中呢？以下和大家分享。技术交流和面试其实有些共通性,比如经常会有类似问题: 如何做到高可用的? 访问峰值达到什么量级? 系统如何撑住的? 高并发下数据一致性如何

Hadoop大数据生态系统及常用组件简介

数据观 • 8年前

经过多年信息化建设，我们已经进入一个神奇的“大数据”时代，无论是在通讯社交过程中使用的微信、QQ、电话、短信，还是吃喝玩乐时的用到的团购、电商、移动支付，都不断产生海量信息数据，数据和我们的工作生活密不可分、须臾难离。　什么是大数据什么是大数据，多大算大，100G算大么？如果是用来存储1080P的高

脱离JVM? Hadoop生态圈的挣扎与演化

36大数据 • 8年前

脱离JVM？ Hadoop生态圈的挣扎与演化

36大数据 • 9年前

文| 李呈祥， Hadoop攻城狮新世纪以来，互联网及个人终端的普及，传统行业的信息化及物联网的发展等产业变化产生了大量的数据，远远超出了单台机器能够处理的范围，分布式存储与处理成为唯一的选项。从2005年开始，Hadoop从最初Nutch项目的一部分，逐步发展成为目前最流行的大数据