集群作业调度程序:工具

问题描述:

我们试图解决与集群作业调度程序相关的问题。集群作业调度程序:工具

问题是下面我们有一组python脚本在集群中执行,启动过程目前通过人工交互完成,我的意思是开始测试,我们有一个bash脚本,它与该集群请求执行所需的资源。我们打算做的是建立一个自动启动过程(应该是合理的,因为它实现了工作状态,并且基于等待工作结束,重新开始执行等)。基本上我们必须在用户工作站和集群之间实现一个层。

另一个额外的困难是我们的图层必须足够聪明才能与不同的集群作业调度程序进行交互。我们想知道是否存在帮助我们与集群进行交互而无需处理每个集群调度程序详细信息的工具或框架。我们在网上搜索过,但没有找到适合我们需求的任何东西。

顺便说一句,我们使用的编程语言是Python。

在此先感谢!

Br.-

看一看的ipcluster_tools。文档很少,但很容易使用。