数据分析
-
Hbase内存磁盘大致关系详解大数据
Hbase内存磁盘关系 磁盘数 diskNum 磁盘容量 diskCapacity 备份数 replications 单个HFile文件大小 hbase.hregion.max.f…
-
HBase不稳定因素分析详解大数据
Hbase不稳定因素分析 配置问题 内存配置不正确 目前hbase内存主要如下几个配置项: 1)HBASE_HEAPSIZE HBase RegionServer是内存贪婪性的,按…
-
Hbase JVM优化详解大数据
Hbase JVM优化 优化项 export HBASE_OPTS=”$HBASE_OPTS -XX:+UseCompressedOops -XX:+UseParNewGC -XX…
-
大数据开源项目集锦(持续更新)详解大数据
(1)Hadoop 一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序 http://hadoop.apache…
-
【Hadoop基础】hadoop fs 命令详解大数据
1,hadoop fs –fs [local | <file system URI>]:声明hadoop使用的文件系统,如果不声明的话,使用当前配置文件配置的,按如下顺…
-
NodeManager代码分析之NodeManager启动过程详解大数据
1、NodeManager概述 NodeManager(NM)是YARN中每个节点上的代理,它管理Hadoop集群中单个计算节点,包括与ResourceManger保持通信,监督C…
-
hadoop知识点总结详解大数据
hadoop知识点总结 hadoop原理 上图中展现了整个HDFS三个重要角色:NameNode、DataNode和Client。NameNode可以看作是分布式文件系统中的管理者…
-
Kerberos 安装详解大数据
Kerberos Install Kerberos 安装 节点信息 name01 datanode01 datanode02 datanode03 datanode04 安装 kd…
-
apache_sentry详解大数据
Hadoop 权限 Sentry Hive beeline连接Hive beeline> !connect jdbc:hive2://datanode03:10000/def…
-
spark yarn-cluster模式提交task流程详解大数据
spark yarn-cluster模式提交task流程