learning pyspark:chapter1.understanding spark
what is Apache Spark?
Apache Spark是一个开源的、功能强大的分布式查询和处理引擎。
Spark Jobs and APIs
执行过程:Execution process
对于spark应用,它的驱动进程在master结点上,执行进程分布在worker结点上。
spark job 可以看作式一有向无环图过程
what is Apache Spark?
Apache Spark是一个开源的、功能强大的分布式查询和处理引擎。
Spark Jobs and APIs
执行过程:Execution process
对于spark应用,它的驱动进程在master结点上,执行进程分布在worker结点上。
spark job 可以看作式一有向无环图过程