【运维平台系列】关于DevOps平台架构思考

  现在很多公司都在推行Devops平台。为了能够提升研发运维效率。这一章节主要写点关于偏ops层面的东西,dev层面的东西主要涉及到研发域的内容包括代码管理、代码编译与发布管理、研发流程项目管理及bug管理等。

   一个大的产品与技术架构图:

【运维平台系列】关于DevOps平台架构思考

后续会将各个子产品域的设计大图整理出来.

1. 关于决策层的思考

基于运维规则 + 基础数据(包括应用的元数据 + 离线大数据分析的结果预测)+ 算法分析 + 机器学习 => 推导出一个最佳决策指令。(1. 关于自主决策)

决策层需要考虑全局锁问题。比如对某个应用进行了扩容机器操作,那另外一个流程就不应该被执行。(2. 关于全局锁机制)

当触发层发现了异常信息(异常事件、异常监控信息)只是一个动作,真正是否会执行还是取决于决策层。所以决策这层后面要做很多离线计算分析。对元数据与规则进行定义就显的非常关键了。

我觉得这套系统里面最核心的应该是

1、数据层(需要提供各种维度的数据、离线与实时数据、历史版本预测数据)

2、决策层(如何做出准确合理的决策来代替人)

其他都是干活层。比如执行器更多的是通过流程编排把各个运维节点串联起来执行。触发层也是定时采集机器上面的数据并计算一个阀值。

数据层里面最核心的一个功能就是如何度量弹性调度的效果。