数据中台
-
MapReduce操作HBase详解大数据
运行HBase时常会遇到个错误,我就有这样的经历。 ERROR: org.apache.hadoop.hbase.MasterNotRunningException: …
-
HBase入门基础教程详解大数据
开发环境 硬件环境:CentOS 6.5 服务器4台(一台为Master节点,三台为Slave节点) 软件环境:Java 1.7.0_45、Eclipse J…
-
YARN源码分析(一)—–ApplicationMaster详解大数据
前言 在之前两周主要学了HDFS中的一些模块知识,其中的许多都或多或少有我们借鉴学习的地方,现在将目光转向另外一个块,被誉为MRv2,就是yarn,在Yarn中,解决了MR中Job…
-
YARN源码分析(二)—–ResourceManager中的NM节点管理详解大数据
前言 继上一篇文章讲述完ApplicationMaster的相关用法,核心主题都是围绕着2个字”应用”,当然在RM中还有另外一项比较重要的服务也很重要,他就…
-
YARN源码分析(三)—–ResourceManager HA之应用状态存储与恢复详解大数据
前言 任何系统即使做的再大,都会有可能出现各种各样的突发状况。尽管你可以说我在软件层面上已经做到所有情况的意外处理了,但是万一硬件出问题了或者说物理层面上出了问题,恐怕就不是多写几…
-
自定义Hive Sql Job分析工具详解大数据
前言 我们都知道,在大数据领域,Hive的出现帮我降低了许多使用Hadoop书写方式的学习成本.使用用户可以使用类似Sql的语法规则写明查询语句,从hive表数据中查询目标数据.最…
-
HDFS源码分析(三)—–数据块关系基本结构详解大数据
前言 正如我在前面的文章中曾经写过,在HDFS中存在着两大关系模块,一个是文件与block数据块的关系,简称为第一关系,但是相比于第一个关系清晰的结构关系,HDFS的第二关系就没有…
-
HDFS源码分析(一)—–INode文件节点详解大数据
前言 在linux文件系统中,i-node节点一直是一个非常重要的设计,同样在HDFS中,也存在这样的一个类似的角色,不过他是一个全新的类,INode.class,后面的目录类等等…
-
Hadoop分布式文件系统–HDFS结构分析详解大数据
前言 在Hadoop内部,具体实现了许多类的文件系统,当然最最被我们用到的就是他的分布式文件系统HDFS了。但是本篇文章不会讲HDFS的主从架构等东西,因为这些东西网上和资料书中都…
-
HDFS源码分析(四)—–节点Decommission机制详解大数据
前言 在Hadoop集群中,按照集群规模来划分,规模可大可小,大的例如百度,据说有4000台规模大小的Hadoop集群,小的话,几十台机器组成的集群也都是存在的。但是不论说是大型的…