监控——Zabbix概述

1.Zabbix概述

  • Zabbix 是一个基于 WEB 界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。zabbix 能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。

  • Zabbix 是由 Alexei Vladishev 创建,目前由 Zabbix SIA 在持续开发和支持。

  • Zabbix 是一个企业级的分布式开源监控方案。

  • Zabbix 是一款能够监控各种网络参数以及服务器健康性和完整性的软件。

  • Zabbix 使用灵活的通知机制,允许用户为几乎任何事件配置基于邮件的告警。这样可以快速反馈服务器的问题。基于已存储的数据,Zabbix提供了出色的报告和数据可视化功能。这些功能使得Zabbix成为容量规划的理想方案。

  • Zabbix 支持主动轮询和被动捕获。

  • Zabbix所有的报告、统计信息和配置参数都可以通过基于Web的前端页面进行访问。基于Web的前端页面可以确保您从任何方面评估您的网络状态和服务器的健康性。

  • Zabbix是免费的。Zabbix是根据GPL通用公共许可证第2版编写和发行的。这意味着它的源代码都是免费发行的,可供公众任意使用, 商业支持 由Zabbix公司提供。

  • ​ zabbix 是并发监控,对 cpu 的要求更高

  • ​ zabbix 在性能和功能上都强大很多

  • ​ zabbix 的图形相当漂亮

  • ​ 支持多种监控方式 zabbix-agent snmp 等等

  • ​ 支持分布式监控,能监控的 agent 非常多

  • ​ zabbix 有图形的 web 配置界面,配置简洁

  • ​ zabbix 支持自动发现功能

2.Zabbix 监控介绍

2.1 Zabbix 监控架构

监控——Zabbix概述

2.2 Zabbix 优点

  • 开源,无软件成本投入
  • Server 对设备性能要求低
  • 支持设备多,自带多种监控模板
  • 支持分布式集中管理,有自动发现功能,可以实现自动化监控
  • 开放式接口,扩展性强,插件编写容易
  • 当监控的 item 比较多服务器队列比较大时可以采用主动状态,被监控客户端主动 从server 端去下载需要监控的 item 然后取数据上传到 server 端。 这种方式对服务器的负载比较小。
  • Api 的支持,方便与其他系统结合

2.3 Zabbix 缺点

  • ​ 需在被监控主机上安装 agent,所有数据都存在数据库里, 产生的数据据很大,瓶颈主要在数据库。
  • ​ 项目批量修改不方便
  • ​ 社区虽然成熟,但是中文资料相对较少,服务支持有限;
  • ​ 入门容易,能实现基础的监控,但是深层次需求需要非常熟悉Zabbix并进行大量的二次定制开发难度较大
  • ​ 系统级别报警设置相对比较多,如果不筛选的话报警邮件会很多;并且自定义的项目报警需要自己设置,过程比较繁琐;
  • ​ 缺少数据汇总功能,如无法查看一组服务器平均值,需进行二次开发;

2.4 Zabbix 监控系统监控对象

  • 数据库: MySQL,MariaDB,Oracle,SQL Server agent

  • 应用软件:Nginx,Apache,PHP,Tomcat agent
    -------------------------------------------------------------------------------------------------------------------------------

  • 集群: LVS,Keepalived,HAproxy,RHCS,F5 agent

  • 虚拟化: VMware,KVM,XEN ,docker,k8s agent

  • 操作系统:Linux,Unix,Windows性能参数 agent
    -------------------------------------------------------------------------------------------------------------------------------

  • 硬件: 服务器,存储,网络设备 IPMI

  • 网络: 网络环境(内网环境,外网环境) SNMP
    -------------------------------------------------------------------------------------------------------------------------------

监控——Zabbix概述

3.Zabbix监控方式

1、被动模式

  • 被动检测:相对于agent而言;agent, server向agent请求获取配置的各监控项相关的数据,agent接收请求、获取数据并响应给server;

2、主动模式

  • 主动检测:相对于agent而言;agent(active),agent向server请求与自己相关监控项配置,主动地将server配置的监控项相关的数据发送给server;
  • 主动监控能极大节约监控server 的资源。

4.Zabbix 架构

Zabbix由几个主要的软件组件构成,这些组件的功能如下。
监控——Zabbix概述

1、Zabbix Server

  • Zabbix server 是 agent 程序报告系统可用性、系统完整性和统计数据的核心组件,是所有配置信息、统计信息和操作数据的核心存储器。

2、Zabbix 数据库存储

  • 所有配置信息和 Zabbix 收集到的数据都被存储在数据库中。

3、Zabbix Web 界面

  • 为了从任何地方和任何平台都可以轻松的访问Zabbix, 我们提供基于Web的Zabbix界面。该界面是Zabbix Server的一部分,通常(但不一定)跟Zabbix Server运行在同一台物理机器上。
  • 如果使用 SQLite,Zabbix Web 界面必须要跟Zabbix Server运行在同一台物理机器上。

4、Zabbix Proxy 代理服务器

  • Zabbix proxy 可以替Zabbix Server收集性能和可用性数据。Proxy代理服务器是Zabbix软件可选择部署的一部分;当然,Proxy代理服务器可以帮助单台Zabbix Server分担负载压力。

5、Zabbix Agent 监控代理

  • Zabbix agents监控代理 部署在监控目标上,能够主动监控本地资源和应用程序,并将收集到的数据报告给Zabbix Server。

6、Zabbix 数据流

  • 监控方面,为了创建一个监控项(item)用于采集数据,必须先创建一个主机(host)。
  • 告警方面,在监控项里创建触发器(trigger),通过触发器(trigger)来触发告警动作(action)。 因此,如果你想收到Server XCPU负载过高的告警,必须满足
    ​ 1、为Server X创建一个host并关联一个用于对CPU进行监控的监控项(Item)。
    ​ 2、创建一个Trigger,设置成当CPU负载过高时会触发
    ​ 3、Trigger被触发,发送告警邮件
    虽然看起来有很多步骤,但是使用模板的话操作起来其实很简单,Zabbix 这样的设计使得配置机制非常灵活易用。

4.Zabbix 常用术语的含义

监控——Zabbix概述
监控——Zabbix概述

1、主机 (host)

  • 一台你想监控的网络设备,用IP或域名表示

2、主机组 (host group)

  • 主机的逻辑组;它包含主机和模板。一个主机组里的主机和模板之间并没有任何直接的关联。通常在给不同用户组的主机分配权限时候使用主机组。

3、监控项 (item)

  • 你想要接收的主机的特定数据,一个度量数据。

4、触发器 (trigger)

  • 一个被用于定义问题阈值和“评估”监控项接收到的数据的逻辑表达式
    当接收到的数据高于阈值时,触发器从“OK”变成“Problem”状态。当接收到的数据低于阈值时,触发器保留/返回一个“OK”的状态。

5、事件 (event)

  • 单次发生的需要注意的事情,例如触发器状态改变或发现有监控代理自动注册

6、异常 (problem)

  • 一个处在“异常”状态的触发器

7、动作 (action)

  • 一个对事件做出反应的预定义的操作。
  • 一个动作由操作(例如发出通知)和条件(当时操作正在发生)组成

8、升级 (escalation)

  • 一个在动作内执行操作的自定义场景; 发送通知/执行远程命令的序列

9、媒介 (media)

  • 发送告警通知的手段;告警通知的途径

10、通知 (notification)

  • 利用已选择的媒体途径把跟事件相关的信息发送给用户

11、远程命令 (remote command)

  • 一个预定义好的,满足一些条件的情况下,可以在被监控主机上自动执行的命令

12、模版 (template)

  • 一组可以被应用到一个或多个主机上的实体(监控项,触发器,图形,聚合图形,应用,LLD,Web场景)的集合
  • 模版的任务就是加快对主机监控任务的实施;也可以使监控任务的批量修改更简单。模版是直接关联到每台单独的主机上。

13、应用 (application)

  • 一组监控项组成的逻辑分组

14、web 场景 (web scenario)

  • 利用一个或多个HTTP请求来检查网站的可用性

15、前端 (frontend)

  • Zabbix提供的web界面

16、Zabbix API

  • Zabbix API允许你使用JSON RPC协议 (是一个无状态且轻量级的远程过程调用(RPC)传送协议,其传递内容透过 JSON 为主) 来创建、更新和获取Zabbix对象(如主机、监控项、图形和其他)信息或者执行任何其他的自定义的任务

17、Zabbix server

  • Zabbix软件实现监控的核心程序,主要功能是与Zabbix proxies和Agents进行交互、触发器计算、发送告警通知;并将数据集中保存等

18、Zabbix agent

  • 一个部署在监控对象上的,能够主动监控本地资源和应用的程序
  • Zabbix agent 部署在监控的目标上,主动监测本地的资源和应用(硬件驱动,内存,处理器统计等)。
  • Zabbix agent收集本地的操作信息并将数据报告给Zabbix server用于进一步处理。一旦出现异常 (比如硬盘空间已满或者有崩溃的服务进程), Zabbix server会主动警告管理员指定机器上的异常。. Zabbix agents 的极端高效缘于它可以利用本地系统调用来完成统计数据的收集。

19、被动(passive)和主动(active)检查

Zabbix agents 可以执行被动和主动两种检查方式
1、被动检查(passive check) 模式中 agent 应答数据请求,Zabbix server(或者proxy)询问agent数据,如CPU 的负载情况,然后 Zabbix agent 回送结果。
2、主动检查(Active checks) 处理过程将相对复杂。 Agent 必须首先从 Zabbix sever 索取监控项列表以进行独立处理,然后周期性地发送新的值给server。
执行被动或主动检查是通过选择相应的监测项目类型来配置的。item type. Zabbix agent 处理监控项类型有 Zabbix agent 和 Zabbix agent (active)。

20、Zabbix proxy

  • 一个帮助 Zabbix Server 收集数据,分担Zabbix Server的负载的程序
  • Zabbix Proxy 是一个可以从一个或多个受监控设备收集监控数据,并将信息发送到Zabbix sever的进程,基本上是代表 sever工作的。 所有收集的数据都在本地进行缓存,然后传送到 proxy 所属的 Zabbix sever。
  • 部署 Proxy 是可选的,但是可能非常有益于分散单个 Zabbix sever 的负载。 如果只有 proxy 收集数据,sever上的进程就会减少 CPU 消耗和磁盘 I / O 负载。
  • Zabbix proxy 是完成远程区域、分支机构、没有本地管理员的网络的集中监控的理想解决方案。
  • Zabbix proxy需要使用独立的数据库。