job的提交流程

hadoop jar jar包 类名 参数
1、客户端向rm提交任务
2、rm生成jobId和path,并返回客户端
3、客户端上传资源,并返回上传成功的结果给rm
4、rm将job任务放入调度队列
5、rm分配一个资源,用来启动appMaster
6、nodemanager从hdfs上拉取资源到本地
7、nodemanager拉取完资源后,向客户端发送申请执行语句的命令
8、客户端将启动命令返回给nodemanager
9、appMaster启动
10、appMaster向rm申请执行maptask的资源
11、rm分配资源
12、nodemanager从hdfs上拉取资源到本地
13、nodemanager拉取完资源后,向appMaster发送申请执行语句的命令
14、appMaster返回执行命令给nodemanager
15、nodemanager启动container,执行task
16、maptask有一个执行完成后,appMaster会想rm申请执行reducetask的资源

job的提交流程

job的提交流程