1.zabbix 基础
zabbix 基础
监控指标
server服务器,router路由器,Switches交换机,I/O systems etc I/O进程子系统
Operating System 操作系统, Networks 网络流量, Applications 应用程序
监控问题
DB down 服务器宕机
Replication Stopped 主从复制
Server not reachable 服务器无法访问
Insufficient disk space 磁盘空间不足
cpu utilization 利用率
Insufficient memory 内存空间不足
监控功能
采集、存储、监控、报警
Zabbix定义
zabbix是一个开源的强大的数据采集工具,又是报警工具。能够自动发现监控设备,分布式监控,能够将网络划分为不同的区域。汇总到总服务器来进行监控管理。为中小型应用提供一体化的解决方案。
可以监控多达10万台设备
zabbix框架
zabbix-server 服务端负责接收agent发送的报告信息,核心组件,所有配置、统计数据、操作数据均由 zabbix-server组织进行
zabbix-database 服务端数据库 专用于存储所有配置信息,以及由zabbix收集的数据
zabbix-agent 客户端 部署在被监控主机上,负责收集本地数据并发送到 server/proxy端
zabbix-web GUI图形化管理平台
zabbix-proxy 分布式监控组件 可选组件,常用于分布式监控环境中,代理server收集部分被监控端的监控 数据,并统一发往server端。
Zabbix监控JAVA应用
在2.0之后支持基于JMX网关,直接监控JVM虚拟机中的各种指标
zabbix监控功能
Zabbix Agent
SNMP Agent
IPMI Agent 服务的硬件端口
Agentless Monitoring 无服务监控,IP,端口
Web Monitoring 监控web页面状态,页面请求访问时间,页面数据的下载速度
DataBase Monitoring 数据库监控
Internal Check 内部自带监控机制,脚本将数据采集返回给服务端进行监控
Calculated Monitoring 计算后的监控,当前web服务器的在线访问人数,每分钟流量
Custom Command Monitoring 客户端写脚本收集数据
Zabbix报警
SMS
Jabber
Chat message
Command Execution
Zabbix常用术语
主机(host) 被监控的网络设备
主机组(host group)主机的逻辑容器,包含主机和模板,同一个组内的主机和模板不能相互连接;主机组通 常在给用户或者用户组指派监控权限时使用。
应用集(Applications)监控指标的逻辑集合,包含同种类的item监控指标
监控项(Items)一个特定监控指标的数据,这些数据来源于被监控对象。item是zabbix进行数据收集的核 心,没有item就没有数据。每个item都有key进行标识。
触发器(Triggers)一个表达式,用于评估某监控对象的item内所接收到的数据是否在合理范围内,即阈值; 接收到的数据量大于阈值时,触发器状态从“OK”转变为“Problem”。恢复后再变回OK。
事件(event)发生一个值得关注的事情,例如触发器的状态转变,新的agent或者重新上线的agent的自动注 册等等。
动作(action)对于特定事件事先定义的处理方法,通过包含(发送通知)和条件(何时执行操作)。
报警(escalation)发送告警或远程执行命令的自定义方案,如每隔5分钟发送一次报警,共发5次。
媒介(media)发送通知的手段或通道,如Email、SMS等
通知 (notification)通过选定的媒介向用户发送的有关某事件的信息。邮件本身的信息。
模板 (Templates)用于快速定义被监控主机的预设条目集合,通常包含了各种常用术语。
前端(frontend)Zabbix的web接口
图像(graph)监控指标的图形
的媒介向用户发送的有关某事件的信息。邮件本身的信息。
模板 (Templates)用于快速定义被监控主机的预设条目集合,通常包含了各种常用术语。
前端(frontend)Zabbix的web接口
图像(graph)监控指标的图形