企业级zabbix监控部署,搭建自动化运维平台
博主公司两三百台服务器只有一个运维,每天服务器巡检工作量太大,就算用ansible也有太多不确定性,十几台服务器可以人工巡检,几百台服务器再刀耕火种本不现实,网上关于zabbix监控平台搭建的教程大多掐头去尾,所以打算详细的写一篇教程以供各位参考
适应大多数公司的监控需求,稍加修改即可成为神器,博主公司一台测试服务器没有开启,某天半夜报警过,但已经是半夜没看手机,第二天下午一看正在被拿来挖矿,挖矿定时任务如下
本文分为三部分
- 搭建zabbix分布式监控,监控系统各类状态
- 结合聊天软件实现服务异常自动报警
- 通过脚本监控系统日志,zabbix发现异常发送消息给运维人员,做到真正从此不再天天服务器巡检
需要达到以下效果
1. zabbix发现异常
2. 通过执行脚本向运维人员发送报警信息
3.通过脚本对系统日志进行监控,触发异常自动报警