【5】Yarn资源调度器
Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台 ,而 MapReduce等运算程序则相当于运行于操作系统之上的应用程序 。
1. Yarn 基本架构
YARN主要由ResourceManager、NodeManager、ApplicationMaster和Container等组件构成。
2. Yarn 工作机制
工作机制详解
3. 作业提交全过程
(1)作业提交过程之YARN
- 作业提交
- 作业初始化
- 任务分配
- 任务运行
- 进度和状态更新
- 作业完成
(2)作业提交过程之MapReduce
4. 资源调度器
具体设置详见:yarn-default.xml 文件
-
先进先出调度器(FIFO)
-
容量调度器(Capacity Scheduler)
-
公平调度器(Fair Scheduler)
5. 任务的推测执行
- 作业完成时间取决于最慢的任务完成时间
- 推测执行机制
- 执行推测任务的前提条件
- 不能启用推测执行机制情况
- 推测执行算法原理