科技猎
立即注册,自主定制私人频道
Hadoop教程
本页是关于频道"Hadoop教程"的所有博文,按照时间倒序展现。实时更新。
总数
6
第
1/1
页
干货▏大数据Hadoop快速入门教程
数据观
•
8年前
1、Hadoop生态概况Hadoop是一个由Apache基金会所开发的分布式系统集成架构,用户可以在不了解分布式底层细节情况下,开发分布式程序,充分利用集群的威力来进行高速运算与存储,具有可靠、高效、可伸缩的特点Hadoop的核心是YARN,HDFS,Mapreduce,常用模块架构如下
Hadoop教程——HDFS简介
36大数据
•
8年前
作者:forfuture一、HDFS的基本概念1.1、数据块(block)HDFS(Hadoop Distributed File System)默认的最基本的存储单位是64M的数据块。和普通文件系统相同的是,HDFS中的文件是被分成64M一块的数据块存储的。不同于普通文件系统的是,HDFS中,如果一个文件小于一个数据
hadoop入门教程(四):mr作业的提交监控、输入输出控制及特性使用
ImportNew
•
11年前
分享到:本文由 importnew - roycewong 翻译自 cloudera。如需转载本文,请先参见文章末尾处的转载要求。书接上回,继续为大家讲解mapreduce相关提交作业并监控jobclient是用户作业与jobtracker交互的主要接口,它提供了提交作业,跟踪作业进度、访问任务报告及logs、以及获取
hadoop教程(二)
ImportNew
•
11年前
英文原文:cloudera,编译:importnew – royce wong书接上回,继续为大家讲解mapreduce用户编程接口mapreduce – 用户编程接口下面将着重谈下mapreduce框架中用户经常使用的一些接口或类的详细内容。了解这些会极大帮助你实现、配置和优化mr任务。当然javadoc
hadoop教程(三): mr重要运行参数
ImportNew
•
11年前
本文由 importnew - roycewong 翻译自 cloudera。如需转载本文,请先参见文章末尾处的转载要求。书接上回,继续为大家讲解mapreduce相关job configurationjobconf是mr任务的配置对象,也是描述mr任务在mapreduce框架中如何执行的主要途径,框架将如实的以该对象
hadoop教程(一)
ImportNew
•
11年前
英文原文:cloudera,编译:importnew – royce wonghadoop从这里开始!和我一起学习下使用hadoop的基本知识,下文将以hadoop tutorial为主体带大家走一遍如何使用hadoop分析数据!这个专题将描述用户在使用hadoop mapreduce(下文缩写成mr)框架过程中面对的
提交建议
微信扫一扫,分享给好友吧。