hadoop之yarn
1. yarn的简介
Yarn 是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于 一个分布式的操作系统平台,而 MapReduce 等运算程序则相当于运行于操作 系统之上的应用程序。
2. yarn的架构
3. yarn的组件
4.yarn的工作流程
- client向yarn提交job,首先找ResourceManager分配资源,
- ResourceManager开启一个Container,在Container中运行一个Application manager
- Application manager找一台nodemanager启动Application master,计算任务所需的计算
- Application master向rm申请运行任务所需的资源
- rm将资源封装发给Application master
- Application master启动一个container容器.
- container要实时把作业进度汇报状态给am
- Application master将任务执行的结果反馈rm。
个人理解:
- yarn是一个资源调度的平台,相当于操作系统.mr相当于跑在操作系统上的程序
- 架构流程图