spark架构设计&编程模型 02

启动spark-shell:

spark架构设计&编程模型 02

spark架构设计&编程模型 02

简单的RDD:

spark架构设计&编程模型 02

上述代码中使用的sc,这是Spark-Shell帮助我们自动生成的SparkContext的实例:

spark架构设计&编程模型 02

我们把生成的RDD的每个元素都乘以3:

spark架构设计&编程模型 02

上述的操作都是transformations我们需要触发一个action才能执行:

spark架构设计&编程模型 02

spark架构设计&编程模型 02

我们可以看到预期结果,但我们可以看到collect操作返回的是一个Array,所以数据不要太多,否则会出现OOM

下面执行下filter操作:

spark架构设计&编程模型 02

spark架构设计&编程模型 02

spark架构设计&编程模型 02

真的spark编程应该是完全函数式的,我们把上述操作用一行代码搞定:

spark架构设计&编程模型 02

spark架构设计&编程模型 02