spark内核源码深度剖析

深度理解spark内核的前提和作用

1、已经达到可以熟练进行Spark编程的程度。

2、Spark内核源码的研究,是Spark学习的承上启下阶段。

3、内核源码研究透彻之后,才可以通往Spark高手 / Spark精通的道路。

4、才可以继续进行Spark性能优化的学习。

5、才可以在实际工作中,在Spark应用报错出现故障时,读懂log,通过log分析问题的原因,甚至根据log直接到源码中寻找答案,最后解决线上故障。

 

spark内核结构:

1、Application

2、spark-submit

3、Driver

4、SparkContext

5、Master

6、Worker

7、Executor

8、Job

9、DAGScheduler

10、TaskScheduler

11、ShuffleMapTask and ResultTask

 

spark内核源码深度剖析