Spark的四种部署方式概括
1.Local模式
Local模式就是运行在一台计算机上的模式,通常用于在本机上测试,当不设置master参数的值时,默认此模式,具体有以下几种设置master的方式。
- local:所有计算都运行在一个线程当中,没有任何并行计算。
- local[n]:指定使用n个线程来运行计算。
- local[*]:按照CPU的最多核数来设置线程数。
2.Standalone模式
设置master参数的值为spark://host:port,即开启Standalone模式,将构建一个基于Master/Slave的资源调度集群,Spark任务提交给Master运行。
3.Yarn模式
Spark客户端直接连接Yarn,不需要格外构建Spark集群,有yarn-client和yarn-cluster两种模式,主要区别在于Driver程序的运行节点不同(yarn-client的Driver程序运行在客户端,适用于交互、调试,而yarn-cluster的Driver程序运行在由ResourceManager启动的ApplicationMaster中,适用于生产环境)。master参数设置为yarn,deploy-mode参数为client或者cluster。
4.Mesos模式
Spark客户端直接连接Mesos,不需要额外构建Spark集群。
在Spark的后续版本中,已经支持连接到Kubernetes集群。
这四种模式的差别在于资源管理者是谁。