区块链
-
初步掌握HDFS的架构及原理详解大数据
目录 HDFS 是做什么的 HDFS 从何而来 为什么选择 HDFS 存储数据 HDFS 如何存储数据 HDFS 如何读取文件 HDFS 如何写入文件 HDFS 副本存放策略 Ha…
-
Hadoop 学习总结之一:HDFS简介详解大数据
一、HDFS的基本概念 1.1、数据块(block) HDFS(Hadoop Distributed File System)默认的最基本的存储单位是64M的数据块。 和普通文件系…
-
从一般分布式设计看HDFS设计思想与架构详解大数据
要想深入学习HDFS就要先了解其设计思想和架构,这样才能继续深入使用HDFS或者深入研究源代码。懂得了“所以然”才能在实际使用中灵活运用、快速解决遇到的…
-
HDFS的客户端操作详解大数据
命令行操作: -help 功能:输…
-
深刻理解HDFS工作机制详解大数据
深入理解一个技术的工作机制是灵活运用和快速解决问题的根本方法,也是唯一途径。对于HDFS来说除了要明白它的应用场景和用法以及通用分布式架构之外更重要的是理解关键步骤的原理和实现…
-
Spark学习笔记6:Spark调优与调试详解大数据
1、使用Sparkconf配置Spark 对Spark进行性能调优,通常就是修改Spark应用的运行时配置选项。 Spark中最主要的配置机制通过SparkConf类对S…
-
Spark学习笔记5:Spark集群架构详解大数据
Spark的一大好处就是可以通过增加机器数量并使用集群模式运行,来扩展计算能力。Spark可以在各种各样的集群管理器(Hadoop YARN , Apache Mesos , …
-
Spark学习笔记4:数据读取与保存详解大数据
Spark对很多种文件格式的读取和保存方式都很简单。Spark会根据文件扩展名选择对应的处理方式。 Spark支持的一些常见文件格式如下: 文本文件 使用文件路径作为参数调…
-
Spark学习笔记3:键值对操作详解大数据
键值对RDD通常用来进行聚合计算,Spark为包含键值对类型的RDD提供了一些专有的操作。这些RDD被称为pair RDD。pair RDD提供了并行操作各个键或跨节点重新进行数据…
-
Spark学习笔记2:RDD编程详解大数据
通过一个简单的单词计数的例子来开始介绍RDD编程。 import org.apache.spark.{SparkConf, SparkContext} object w…