AIOps案例: 阿里巴巴的智能监控系统

说明:该文章是对阿里巴巴高级技术专家 王肇刚在2018年云栖大会-上海峰会上分享的《AIOps智能监控在阿里巴巴集团的成功实践》内容的学习总结。

一、如何孵化AIops能力,要从技术架构和团队架构着手

AIOps案例: 阿里巴巴的智能监控系统

至于团队架构,我觉得《AIops企业实施白皮书》上的一样

AIOps案例: 阿里巴巴的智能监控系统

二、我看到的亮点:

2.1 整个故障处理流程链进行智能化。好多企业也许智能化了一个环节,阿里在群求运行指挥中心中把整个故障流程都智能化,我觉得还是挺厉害的。

AIOps案例: 阿里巴巴的智能监控系统

2.2 智能基线监控

对于监控曲线,根据历史经验设立智能基线,当业务触发基线时候进行报警。主要分析包括 单指标多维下钻分析、多指标相关性分析。

AIOps案例: 阿里巴巴的智能监控系统

2.3 智能监控体系还是比较健全

AIOps案例: 阿里巴巴的智能监控系统

最后总结:

个人觉得阿里作为技术牛叉的企业,这次分享感觉干货太少,讲内容的PPT也就是7页左右,并且好多内容和白皮书拷贝过来的。基线监控大多数做智能监控的都讲过。整体还是让人有点失望

要原材料请在博客下面留言。

要是你在西安,感兴趣一起学习AIOPS,欢迎加入QQ群 860794445。