区块链
-
Driver端如何正确取消Spark中的job详解大数据
1. SparkContext提供了一个取消job的api class SparkContext(config…
-
Tuning-java-garbage-collection-for-spark-applications详解大数据
原文链接:https://databricks.com/blog/2015/05/28/tuning-java-garbage-collection-for-spark-appli…
-
Spark-Sql源码解析之一 引言详解大数据
1.1 Demo 以一个Spark-Sql的例子开始: public class TestSparkSql { public static void main(String[] a…
-
Spark-Sql源码解析之二 Sqlparser:sql –> unresolved logical plan详解大数据
前面章节讲解了Spark-SQL中的核心流程,接下来主要讲解如何将sql语句转化为UnResolved Logical Plan(包含UnresolvedRelation、 Unr…
-
Spark-Sql源码解析之三 Analyzer:Unresolved logical plan –> analyzed logical plan详解大数据
Analyzer主要职责就是将通过Sql Parser未能Resolved的Logical Plan给Resolved掉。 lazy val analyzed: LogicalPl…
-
Spark-Sql源码解析之四 Optimizer: analyzed logical plan –> optimized logical plan详解大数据
Optimizer的主要职责是将Analyzer给Resolved的Logical Plan根据不同的优化策略Batch,来对语法树进行优化,优化逻辑计划节点(Logical Pl…
-
Spark-Sql源码解析之五 Spark Planner:optimized logical plan –> spark plan详解大数据
前面描述的主要是逻辑计划,即sql如何被解析成logicalplan,以及logicalplan如何被analyzer以及optimzer,接下来主要介绍逻辑计划如何被翻译成物理计…
-
Spark-Sql源码解析之六 PrepareForExecution: spark plan -> executed Plan详解大数据
在SparkPlan中插入Shuffle的操作,如果前后2个SparkPlan的outputPartitioning不一样的话,则中间需要插入Shuffle的动作,比分说聚合函数,…
-
Spark-Sql源码解析之七 Execute: executed Plan -> RDD[Row]详解大数据
SparkPlan如何执行呢,SparkPlan是如何转变为RDD[Row]的呢?首先看一段代码: SQLContext sqlContext = new SQLContext(j…
-
Spark-Sql源码解析之八 Codegen详解大数据
Codegen,动态字节码技术,那么什么是动态字节码技术呢?先看来一段代码,假设SparkPlan为Sort case class Sort( sortOrder: Seq[Sor…