数据采集
-
Spark HA模式访问Hadoop HA下的数据详解大数据
首先是需要将hadoop的配置文件core-site,xml和hdfs-site.xml 拷贝到Spark conf目录下 然后启动提交即可 spark-submit /…
-
SparkStreaming和Drools结合的HelloWord版详解大数据
关于sparkStreaming的测试Drools框架结合版 package com.dinpay.bdp.rcp.service; import java.math.BigDec…
-
Spark原理小总结详解大数据
1、spark是什么? 快速,通用,可扩展的分布式计算引擎 2、弹性分布式数据集RDD RDD(Resilient Distributed Dataset)叫做分布式数据集…
-
贴几个spark提交任务的小脚本详解大数据
spark单个master节点的提交方式 spark-submit –master spark://hadoop-namenode-02:7077 / –class com.d…
-
Notes for Hadoop the definitive guide详解大数据
1. Introduction to HDFS 1.1. H…
-
Hadoop学习总结之二:HDFS读写过程解析详解大数据
一、文件的打开 1.1、客户端 HDFS打开一个文件,需要在客户端调用DistributedFileSystem.open(Path f, int bufferSize),其实现为…
-
Hadoop学习总结之三:Map-Reduce入门详解大数据
1、Map-Reduce的逻辑过程 假设我们需要处理一批有关天气的数据,其格式如下: 按照ASCII码存储,每行一条记录 每一行字符从0开始计数,第15个到第18个字符为年 第25…
-
Hadoop学习总结之四:Map-Reduce的过程解析详解大数据
一、客户端 Map-Reduce的过程首先是由客户端提交一个任务开始的。 提交任务主要是通过JobClient.runJob(JobConf)静态函数实现的: public sta…
-
MapReduce源码分析总结详解大数据
转者注:本来想在Hadoop学习总结系列详细解析HDFS以及Map-Reduce的,然而查找资料的时候,发现了这篇文章,并且发现caibinbupt已经对Hadoop的源代码已经进…
-
Hadoop学习总结之五:Hadoop的运行痕迹详解大数据
Hadoop 学习总结之一:HDFS简介 Hadoop学习总结之二:HDFS读写过程解析 Hadoop学习总结之三:Map-Reduce入门 Hadoop学习总结之四:Map-Re…