Master资源调度算法原理剖析与源码分析

在Master类中的schedule方法是master的主要的资源调度的方法

首先是对driver进行调度

Master资源调度算法原理剖析与源码分析

上面中的提交模式在基于YARN的两种提交模式中有介绍

进入 Random.shuffle()方法,主要的功能是随机打乱集合内的元素

Master资源调度算法原理剖析与源码分析

进入到launchDriver(worker, driver)方法

Master资源调度算法原理剖析与源码分析

接下来是对Application进行调度

Application的调度算法有两种,这两种算法是可以手动切换的,默认是启用spreadOutApps,一种是spreadOutApps

Master资源调度算法原理剖析与源码分析

进入canUse(app, _)方法

Master资源调度算法原理剖析与源码分析

进入addExecutor(usableWorkers(pos), assigned(pos))方法

Master资源调度算法原理剖析与源码分析

在application内部缓存结构中添加executor,并且创建ExecutorDesc对象,其中封装了,给executor分配多少个cpu core,在sprik1.3版本中通过spark-submit可以指定executor和cpu的数量以及内存数量,基于这种按中的cpu来分配的机制,最后executor的实际数量,以及每个executor的cpu可能与配置是不一样的,比如要求3个executor,每个要3个cpu,比如有9个worker,每个有一个cpu,那么其实总共要分配9个core,根据这种算法,会给每个worker分配一个core,然后每个worker启动一个executor最后会启动9个executor,每个executor有1个cpu core

进入launchExecutor(usableWorkers(pos), exec)方法

Master资源调度算法原理剖析与源码分析

通过这种算法其实会将每个application,要启动的executor,都平均分布到各个worker上去,比如有20个cpucore要分配,那么实际会循环两遍worker,每次循环,给每个worker分配1个core,最后每个worker分配2个core

 

另一种是非spreadOutApps

Master资源调度算法原理剖析与源码分析

这种算法与上一种算法正好相反,每个application都尽量可能分配到尽量少的worker上去,比如总共有10个worker,每个有10个core,app总共要分配20个core,其实只会分配到两个worker上去,每个worker都占满10个core,其余的app都只能分配到下个worker。

例如application,spark-submit里,配置的是要10个executor,每个要2个core,那么总共是20个core在这种算法下其实只会启动两个executor,每个有10个core