科技猎
立即注册,自主定制私人频道
hadoop 生态
本页是关于频道"hadoop 生态"的所有博文,按照时间倒序展现。实时更新。
总数
10
第
1/1
页
Hadoop 生态圈危机四伏,如何应对大数据基础平台的安全威胁
雷锋网
•
7年前
当前,以 Hadoop 为基础的大数据开源生态圈应用非常广泛。国内 Hadoop 已经广泛应用于金融、电信、制造、能源以及医疗健康领域,而这些领域每天都有数以亿计的数据产生,对于大数据资产的存储、挖掘、分析等流程都会涉及到用户信息安全。因此,如何构建一个开源、稳定、高性能而又安全可靠的大数据管理平台是当务之急。本期硬创
一步一步学习大数据:Hadoop 生态系统与场景-36大数据
36大数据
•
7年前
作者:LeeHadoop概要到底是业务推动了技术的发展,还是技术推动了业务的发展,这个话题放在什么时候都会惹来一些争议。 随着互联网以及物联网的蓬勃发展,我们进入了大数据时代。IDC预测,到2020年,全球会有44ZB的数据量。 传统存储和技术架构无法满足需求 。在2013年出版的《大数据时代》
比较Apache Hadoop 生态系统中不同的文件格式和存储引擎的性能
36大数据
•
7年前
主题这篇文章提出了在Apache Hadoop 生态系统中对比一些当前流行的数据格式和可用的存储引擎的性能:Apache Avro, Apache Parquet, Apache HBase 和 Apache Kudu 空间效率, 提取性能, 分析扫描以及随机数据查找等领域。这有助于理解它们中的每一个如何(何时)改善你
hadoop生态系统的详细介绍
36大数据
•
7年前
1、Hadoop生态系统概况Hadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。Hadoop的核心是HDFS和MapReduce,hadoop2.0还包括YARN。下图为hadoop的生态系统:2、HDFS(Hadoop分布式文件系统)源自于Google的GFS论文,发表于2003年
不同文件格式和存储引擎在Apache Hadoop生态系统中的性能比较
36大数据
•
7年前
作者 | Zbigniew Baranowski ZBigniew Baranowski是一位数据库系统专家,并且是提供和支持中央数据库和基于Hadoop服务的CERN(欧洲核子研究组织)的成员。此博客最初发表在CERN的“CERN数据库”博客上,其转发已获得CERN的许可。网址:http://blog.clo
Docker生态会重蹈Hadoop的覆辙吗?
36大数据
•
8年前
一、Docker的兴起和Hadoop何其相似2015年说是Docker之年不为过,Docker热度高涨,IT从业人员要是说自己不知道Docker都不好意说自己是做IT的。2016年开始容器管理、集群调度成为热点,K8s开始成为热点。但这一幕和2013年的Hadoop大数据何其相似,当年你要说自己不知道大数据,或是知道
电商平台实战经验:电商中的Hadoop生态系统应用
数据观
•
8年前
导读: 我们都知道Hadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。而如何将Hadoop生态系统应用到电商中呢?以下和大家分享。 技术交流和面试其实有些共通性,比如经常会有类似问题: 如何做到高可用的? 访问峰值达到什么量级? 系统如何撑住的? 高并发下数据一致性如何
Hadoop大数据生态系统及常用组件简介
数据观
•
8年前
经过多年信息化建设,我们已经进入一个神奇的“大数据”时代,无论是在通讯社交过程中使用的微信、QQ、电话、短信,还是吃喝玩乐时的用到的团购、电商、移动支付,都不断产生海量信息数据,数据和我们的工作生活密不可分、须臾难离。 什么是大数据什么是大数据,多大算大,100G算大么?如果是用来存储1080P的高
脱离JVM? Hadoop生态圈的挣扎与演化
36大数据
•
8年前
作者:李呈祥 本文由知乎《大数据应用与实践》专栏 李呈祥授权发布,版权所有归作者,转载请联系作者!新世纪以来,互联网及个人终端的普及,传统行业的信息化及物联网的发展等产业变化产生了大量的数据,远远超出了单台机器能够处理的范围,分布式存储与处理成为唯一的选项。从2005年开始,Hadoop从最初Nutch
脱离JVM? Hadoop生态圈的挣扎与演化
36大数据
•
9年前
文| 李呈祥 , Hadoop攻城狮新世纪以来,互联网及个人终端的普及,传统行业的信息化及物联网的发展等产业变化产生了大量的数据,远远超出了单台机器能够处理的范围,分布式存储与处理成为唯一的选项。从2005年开始,Hadoop从最初Nutch项目的一部分,逐步发展成为目前最流行的大数据
提交建议
微信扫一扫,分享给好友吧。