企业级zabbix监控部署,搭建自动化运维平台

博主公司两三百台服务器只有一个运维,每天服务器巡检工作量太大,就算用ansible也有太多不确定性,十几台服务器可以人工巡检,几百台服务器再刀耕火种本不现实,网上关于zabbix监控平台搭建的教程大多掐头去尾,所以打算详细的写一篇教程以供各位参考
适应大多数公司的监控需求,稍加修改即可成为神器,博主公司一台测试服务器没有开启,某天半夜报警过,但已经是半夜没看手机,第二天下午一看正在被拿来挖矿,挖矿定时任务如下

企业级zabbix监控部署,搭建自动化运维平台

本文分为三部分

  • 搭建zabbix分布式监控,监控系统各类状态
  • 结合聊天软件实现服务异常自动报警
  • 通过脚本监控系统日志,zabbix发现异常发送消息给运维人员,做到真正从此不再天天服务器巡检

需要达到以下效果

1. zabbix发现异常
企业级zabbix监控部署,搭建自动化运维平台
2. 通过执行脚本向运维人员发送报警信息
企业级zabbix监控部署,搭建自动化运维平台
企业级zabbix监控部署,搭建自动化运维平台

3.通过脚本对系统日志进行监控,触发异常自动报警
企业级zabbix监控部署,搭建自动化运维平台
企业级zabbix监控部署,搭建自动化运维平台

正在更新。。。