1.zabbix 基础

zabbix 基础

监控指标

server服务器,router路由器,Switches交换机,I/O systems etc I/O进程子系统

Operating System 操作系统, Networks 网络流量, Applications 应用程序

监控问题

DB down 服务器宕机

Replication Stopped 主从复制

Server not reachable 服务器无法访问

Insufficient disk space 磁盘空间不足

cpu utilization 利用率

Insufficient memory 内存空间不足

监控功能

采集、存储、监控、报警

Zabbix定义

​ zabbix是一个开源的强大的数据采集工具,又是报警工具。能够自动发现监控设备,分布式监控,能够将网络划分为不同的区域。汇总到总服务器来进行监控管理。为中小型应用提供一体化的解决方案。

​ 可以监控多达10万台设备


zabbix框架

zabbix-server 服务端负责接收agent发送的报告信息,核心组件,所有配置、统计数据、操作数据均由 zabbix-server组织进行

zabbix-database 服务端数据库 专用于存储所有配置信息,以及由zabbix收集的数据

zabbix-agent 客户端 部署在被监控主机上,负责收集本地数据并发送到 server/proxy端

zabbix-web GUI图形化管理平台

zabbix-proxy 分布式监控组件 可选组件,常用于分布式监控环境中,代理server收集部分被监控端的监控 数据,并统一发往server端。

1.zabbix 基础

Zabbix监控JAVA应用

​ 在2.0之后支持基于JMX网关,直接监控JVM虚拟机中的各种指标


zabbix监控功能

Zabbix Agent

SNMP Agent

IPMI Agent 服务的硬件端口

Agentless Monitoring 无服务监控,IP,端口

Web Monitoring 监控web页面状态,页面请求访问时间,页面数据的下载速度

DataBase Monitoring 数据库监控

Internal Check 内部自带监控机制,脚本将数据采集返回给服务端进行监控

Calculated Monitoring 计算后的监控,当前web服务器的在线访问人数,每分钟流量

Custom Command Monitoring 客户端写脚本收集数据


Zabbix报警

E-mail

SMS

Jabber

Chat message

Command Execution


Zabbix常用术语

主机(host) 被监控的网络设备

主机组(host group)主机的逻辑容器,包含主机和模板,同一个组内的主机和模板不能相互连接;主机组通 常在给用户或者用户组指派监控权限时使用。

应用集(Applications)监控指标的逻辑集合,包含同种类的item监控指标

监控项(Items)一个特定监控指标的数据,这些数据来源于被监控对象。item是zabbix进行数据收集的核 心,没有item就没有数据。每个item都有key进行标识。

触发器(Triggers)一个表达式,用于评估某监控对象的item内所接收到的数据是否在合理范围内,即阈值; 接收到的数据量大于阈值时,触发器状态从“OK”转变为“Problem”。恢复后再变回OK。

事件(event)发生一个值得关注的事情,例如触发器的状态转变,新的agent或者重新上线的agent的自动注 册等等。

动作(action)对于特定事件事先定义的处理方法,通过包含(发送通知)和条件(何时执行操作)。

报警(escalation)发送告警或远程执行命令的自定义方案,如每隔5分钟发送一次报警,共发5次。

媒介(media)发送通知的手段或通道,如Email、SMS等

通知 (notification)通过选定的媒介向用户发送的有关某事件的信息。邮件本身的信息。

模板 (Templates)用于快速定义被监控主机的预设条目集合,通常包含了各种常用术语。

前端(frontend)Zabbix的web接口

图像(graph)监控指标的图形

的媒介向用户发送的有关某事件的信息。邮件本身的信息。

模板 (Templates)用于快速定义被监控主机的预设条目集合,通常包含了各种常用术语。

前端(frontend)Zabbix的web接口

图像(graph)监控指标的图形

1.zabbix 基础