Spark
-
spark sql整合hive-重要
spark sql整合hive 在spark sql中使用hive的元数据 spark sql是使用spark进行计算的,hive使用MR进行计算的 1、在hive的hive-si…
-
Spark初识
Spark初识 回顾一下前面的MapReduce流程,可以更好的学习spark spark的框架 spark为什么比hadoop速度快 spark支持哪些语言 spark的运行模式…
-
spark与MapReduce的区别
spark与MapReduce的区别 内存和磁盘的区别 spark最核心的概念是RDD(弹性分布式数据集),它的所有RDD在并行运算过程程中,可以做到数据共享,也就是可以重复使用m…
-
Spark快速上手(6)Spark核心编程-RDD行动算子Action
RDD(3) RDD行动算子 所谓行动算子,就是触发Job执行的方法 reduce 函数签名def reduce(f: (T, T) => T): T函数说明聚集RDD中的所…
-
Spark快速上手(7)Scala使用 JUnit4 单元测试
备忘 导入依赖 <dependency> <groupId>junit</groupId> <artifactId>junit<…
-
2022.4.17学习成果
spark 1)解压spark安装包到/usr/local/src/目录,并改名为spark master机器: [root@master ~]# tar -zxvf /opt/s…
-
|NO.Z.00044|——————————|BigDataEnd|——|Hadoop&Spark.V05|——————————————|Spa
[BigDataHadoop:Hadoop&Spark.V05] [BigDataHadoop…