数据分析
-
Hadoop分布式文件系统–HDFS结构分析详解大数据
前言 在Hadoop内部,具体实现了许多类的文件系统,当然最最被我们用到的就是他的分布式文件系统HDFS了。但是本篇文章不会讲HDFS的主从架构等东西,因为这些东西网上和资料书中都…
-
HDFS源码分析(四)—–节点Decommission机制详解大数据
前言 在Hadoop集群中,按照集群规模来划分,规模可大可小,大的例如百度,据说有4000台规模大小的Hadoop集群,小的话,几十台机器组成的集群也都是存在的。但是不论说是大型的…
-
JobTracker作业启动过程分析详解大数据
在Hadoop中,启动作业运行的方式有很多,可以用命令行格式把打包好后的作业提交还可以,用Hadoop的插件进行应用开发,在这么多的方式中,都会必经过一…
-
NodeManagerMetrics上精确化Container指标监控详解大数据
前言 在准备开始写本篇文章之前,我一直在想应该给本篇文章定一个怎样的标题才能最精准的表达出主题而又不会让字数变得过多.因为Metric指标监控在YARN中早已经存在了,而且支持的指…
-
HDFS源码分析(五)—–节点注册与心跳机制详解大数据
前言 在Hadoop的HDFS启动的时候,不知道大家有没有注意到一个细节,一般都是先启动NameNode,然后再启动DataNode,细想一下,原因就很简单了,因为NameNode…
-
HDFS源码分析(六)—–租约详解大数据
前言 任何系统即使做的再大,都会有可能出现各种各样的突发状况。尽管你可以说我在软件层面上已经做到所有情况的意外处理了,但是万一硬件出问题了或者说物理层面上出了问题,恐怕就不是多写几…
-
Partitioner分区过程分析详解大数据
Partition的中文意思就是分区,分片的意思,这个阶段也是整个MapReduce过程的第三个阶段,就在Map任务的后面,他的作用就是使key分到通过一定的分区算法…
-
hadoop添加节点和删除节点详解大数据
转自:http://www.cnblogs.com/ggjucheng/archive/2012/04/22/2465625.html 添加DataNode 1.部署hadoop和…
-
Sqoop实现MySql/Oracle与Hdfs/Hbase互导数据详解大数据
下文将重点说明通过Sqoop实现Mysql与HDFS互导数据,Mysql与Hbase,Oracle与Hbase的互导最后给出命令。 一、Mysql与HDFS互导数据 环境: 宿主机…
-
Hadoop代码笔记Hadoop作业提交之客户端作业提交详解大数据
【Hadoop代码笔记】Hadoop作业提交之客户端作业提交 by Douba on 2013年9月11日 in had…