vmware资源管理-2

task manager
要监视来宾操作系统中的性能,请使用您熟悉的工具,如Windows任务管理器。
vmware资源管理-2
Windows任务管理器帮助您度量来宾操作系统中的CPU和内存使用。您在来宾操作系统中使用工具进行的度量反映了来宾操作系统的资源使用情况,而不一定反映了虚拟机本身(VMware)的资源使用情况

VMware Tools中的Perfmon DLL提供了虚拟机处理器和内存对象来访问虚拟机中的主机统计数据。
vmware资源管理-2
VMware工具包括一个名为Perfmon DLL的函数库。Perfmon允许您访问来宾虚拟机中的关键主机统计信息。Perfmon性能对象(VM处理器和VM内存)允许您查看客户操作系统的实际CPU和内存使用情况,以及观察到的CPU和内存使用情况。
vmware资源管理-2
例如,您可以使用VM处理器对象来查看% Processor时间计数器,它监视虚拟机当前的虚拟处理器负载。同样,您可以使用处理器对象并查看% Processor时间计数器(未显示),它监视所有运行进程对处理器的总使用情况。

esxtop是vSphere的主要实时性能监控工具:
•该工具可以作为esxtop在主机的本地ESXi Shell中运行。
•此工具也可以作为resxtop从vSphere CLI远程运行。•esxtop的工作方式与Linux操作系统中的*性能实用工具类似。在本例中,您输入小写c和大写V来查看虚拟机的CPU指标。
您可以通过使用vSphere ESXi Shell与ESXi主机的管理接口进行通信来运行esxtop实用程序。您必须具有根用户权限。

使用概览性能图表时,您可以在vSphere客户端中访问概览和高级性能图表。
概述性能图表显示了VMware认为对监视性能和诊断问题最有用的性能统计数据。
根据您在目录中选择的对象,性能图表提供了主机或VM执行情况的快速可视化表示。
vmware资源管理-2
使用高级性能图表
在vSphere客户机中,您可以自定义高级性能图表的外观。高级图表有以下特点:
•比概述图表更多的信息:指向图表中的一个数据点,以显示关于该特定数据点的详细信息。
•可定制的图表:更改图表设置。保存自定义设置以创建自己的图表。•将数据保存到图像文件或电子表格中。

vmware资源管理-2

图表选项:实时和历史
vmware资源管理-2
实时信息是每隔20秒为过去一小时生成的信息。历史信息是根据不同的具体情况为过去的一天、一周、一个月或一年生成的。
默认情况下,vCenter服务器有四个归档间隔:天、周、月和年。每个时间间隔指定在vCenter服务器数据库中归档统计数据的时间长度。
您可以配置启用了哪些间隔以及启用的时间段。您还可以通过设置收集级别来配置在收集间隔期间使用的数据计数器的数量。
收集间隔和收集级别共同决定了在vCenter服务器数据库中收集和存储了多少统计数据。
例如,使用该表,过去日统计数据每5分钟显示一个数据点,总共有288个样本。过去一年的统计数据显示,每天有1个数据点,即365个样本。

实时统计数据不存储在数据库中。它们存储在ESXi主机上的平面文件中,存储在vCenter服务器实例的内存中。ESXi主机只收集主机或主机上可用的vm的实时统计信息。每20秒直接在ESXi主机上收集实时统计信息。

如果您查询实时统计信息,vCenter服务器将直接查询每个主机的数据。vCenter服务器此时不处理数据。vCenter服务器只将数据传递给vSphere客户端。

在ESXi主机上,统计时间为30分钟,之后收集90个数据点。数据点被聚合、处理并返回到vCenter服务器。然后,vCenter服务器将数据库中的数据存档为一天收集间隔的数据点。

为了确保在收集和将数据写入数据库时不影响性能,使用循环查询来收集数据计数器统计信息。查询针对指定的收集间隔进行。在每个时间间隔结束时,进行数据计算。

图表类型:条形图和饼图
vmware资源管理-2
柱状图显示所选数据中心中数据存储的存储指标。每个数据存储都表示为图表中的条形图。每个bar显示基于文件类型的指标:虚拟磁盘、其他VM文件、快照、交换文件和其他文件。

饼图显示基于文件类型或vm的单个对象的存储指标。例如,数据存储的饼图可以显示占用最大空间的vm占用的存储空间量。

折线图显示单个inventory对象的指标,例如,ESXI主机上每个CPU的指标
在折线图中,每个性能计数器的数据被绘制在图表中的单独一行上。例如,主机的CPU图表可以包含主机的每个CPU的一行。每一行都描绘了CPU随时间的使用情况。

堆叠图表对于比较多个主机或vm之间的资源分配和使用非常有用
一个主机的堆叠CPU使用情况图表显示了主机上消耗CPU资源最多的5个vm的CPU使用情况。另一个数量包含剩余vm的总CPU使用量。主机本身的指标显示在单独的折线图中。默认情况下,将出现具有最高数据计数器值的10个子对象。

vmware资源管理-2
保存图表
单击图上的Save图表图标以保存性能图表信息。您可以以PNG、JPEG和CSV格式保存信息。
在vSphere Web客户机中,可以将高级性能图表中的数据以各种图形格式或Microsoft Excel格式保存到文件中。当您保存一个图表时,您选择文件类型并将图表保存到您选择的位置。

关于对象和计数器

性能图表图形化地显示由vCenter Server管理的设备和实体的CPU、内存、磁盘、网络和存储指标。

对象是设备的实例或聚合(对象指的是为其收集统计信息的实例。例如,您可以收集单个CPU、所有CPU、主机或特定网络设备的统计信息。
)
•示例:vCPU0、vCPU1、vmhba1:1:2,所有NICs

计数器上的聚合标识要收集哪些统计信息。(计数器表示您正在收集的实际统计信息。例如,给定设备每秒使用的CPU数量或网络包数量。
)
•例子:- CPU:使用时间,准备时间,使用率(%)
-网卡:网络数据包接收
-内存:内存交换
vCenter Server允许用户决定显示多少或多少关于特定设备类型的信息。您可以通过选择一个或多个对象和计数器来控制图表显示的信息量。

关于统计类型
统计类型是统计区间中使用的度量单位
统计类型是指统计间隔期间使用的度量,与度量单位相关。

统计类型如下:
•比率:当前统计区间的值•增量:与以前统计区间的变化•绝对值:绝对值(与统计区间无关)
例如,CPU使用率是一个速率,CPU准备时间是一个增量,内存活动是一个绝对值
vmware资源管理-2

Rollup是统计时间间隔之间的转换函数:
•将过去5分钟的统计时间转换为一个过去一天的值:
-将15个20秒的统计时间转换为一个单独的值。

•过去30分钟的统计数据被转换成一个过去一周的值:

  • 6个5分钟的统计数据被汇总成一个单独的值。

根据历史间隔,数据以不同的特异性显示。过去时间统计以20秒的特异性显示,过去时间统计以5分钟的特异性显示。将一个时间间隔转换为另一个时间间隔的平均值称为rollup。

可以使用不同的rollup类型。rollup类型确定为计数器返回的统计值的类型:

•Average(平均):将间隔时间内收集的数据进行汇总和平均。
•最小值:最小值被卷起。
•最大值:最大值是卷起的。

最小值和最大值只在收集级别4中收集和显示。最小和最大rollup类型用于捕获间隔期间数据中的峰值。对于实时数据,该值是当前的最小值或当前的最大值。对于历史数据,该值是平均最小值或平均最大值。例如,CPU使用情况图表的以下信息表明,平均值是在收集级别1收集的,而最小值和最大值是在收集级别4收集的:

•汇总类型:平均(最小/最大)
•收集级别:1(4)统计级别包括总和和最新:
•汇总:对收集到的数据进行汇总。性能图表中显示的度量值表示在间隔期间收集的数据的总和。
•最新:间隔期间收集的数据是一个设定值。性能图表中显示的值表示当前值。
例如,如果您查看CPU性能图表中的CPU使用计数器,则rollup类型是求和。因此,对于给定的5分钟间隔,该间隔中所有20秒样本的和被表示出来。

解释性能数据的关键是从客户操作系统、VM和主机的角度观察数据的范围。

例如,Task Manager中的CPU使用统计信息并不能向您提供完整的情况。您还应该查看VM和VM所在主机的CPU使用情况。
使用vSphere客户端中的性能图表来查看这些数据。

处理器受限vm
如果CPU使用率持续很高,则虚拟机将受到CPU的限制。但是,主机可能有足够的CPU供其他虚拟机运行。
如果CPU使用率很高,请检查VM的CPU使用率统计数据。使用概述图表或高级图表来查看CPU使用情况。
如果VM的CPU使用率在一段时间内居高不下,那么VM就会受到CPU的限制。主机上的其他vm可能有足够的CPU资源来满足它们的需求。

如果不止一个VM受到CPU的约束,那么关键指标是CPU就绪时间。就绪时间指的是VM准备好执行指令但却不能执行的时间间隔,因为它不能被调度到CPU上。有几个因素会影响准备时间:

•整体CPU使用:当使用率较高时,您更可能看到就绪时间,因为当另一个VM准备运行时,CPU更可能处于繁忙状态。

•资源消耗者的数量(在本例中是客户操作系统):当主机运行大量VM时,调度器更有可能需要在已经运行或正在排队的VM后对VM进行排队。良好的就绪时间值因工作负载而异。要为工作负载找到合适的就绪时间值,请收集每个VM随时间变化的就绪时间数据。当您有了每个VM的就绪时间数据时,估计观察到的响应时间中有多少是就绪时间。如果在满足应用程序的响应时间目标方面的不足主要是由于准备时间的原因,那么应该采取步骤来解决准备时间过多的问题。

如果存在以下条件,多个vm将受到CPU的约束

  • 来宾操作系统的高CPU使用率
  • vm的CPU就绪值相对较高

比较VM使用的内存和授予的值,以确定VM是否为内存受

如果VM消耗了它的全部内存分配,那么VM可能受到内存约束,您应该考虑增加VM的内存大小

任何bollooning或swap的迹象都表明您的主机可能受到内存限制
•如果膨胀活动很高,如果所有虚拟机都有足够的内存,这种状态可能不是问题。

•如果气球活动频繁,而来宾操作系统正在交换,那么虚拟机的内存就会受到限制。

磁盘密集型应用程序可能会使存储或路径饱和。如果您怀疑虚拟机受到磁盘访问的限制:
•测量虚拟机和存储之间的吞吐量和延迟。
•使用高级性能图表来监控:
-读速率和写速率
-读延迟和写延迟

磁盘性能问题通常是由底层物理存储硬件饱和引起的。您可以使用vCenter服务器高级性能图表来测量不同级别的存储性能。这些图表允许您监视从虚拟机的数据存储到特定存储路径的所有内容,从而可以深入了解虚拟机的性能。

如果选择主机对象,则可以查看数据存储、存储适配器或存储路径的吞吐量和延迟。存储适配器图表仅可用于光纤通道存储。存储路径图可用于Fibre Channel和iSCSI存储,而不适用于NFS。如果选择虚拟机对象,则可以查看虚拟机的数据存储或特定虚拟磁盘的吞吐量和延迟。要监视吞吐量,请查看读速率和写速率计数器。要监视延迟,请查看读延迟和写延迟计数器。

监视磁盘延迟

要确定磁盘性能问题,请监视两个磁盘延迟数据计数器:•内核命令延迟:-这个计数器是每个SCSI命令在VMkernel中花费的平均时间。-高数值(大于2或3毫秒)表示一个工作过度的数组或一个工作过度的主机。

•物理设备命令延迟:这个计数器是物理设备完成一个SCSI命令的平均时间。-高的数字(大于15或20毫秒)代表一个缓慢或超负荷工作的数组。

对于机械磁盘(hdd),大于15或20毫秒

对于SDDs 大于3或4毫秒

网络密集型应用程序通常会在ESXi主机之外的路径段上出现瓶颈:
•例如:服务器和客户端之间的WAN链接,如果您怀疑虚拟机受到网络的约束:
•验证是否安装了VMware工具。只有安装了VMware工具,才可以使用增强的网络驱动程序。
•测量虚拟机与其对等系统之间的有效带宽。
•检查丢失的接收包和发送包。

关于警报

告警是针对库存中的对象所发生的选定事件或条件而发出的通知。
您可以确认警报,以让其他用户知道您是问题的所有者。例如,VM有一个用于监视CPU使用的警报设置。警报被配置为在触发警报时向管理员发送电子邮件。VM CPU使用峰值,触发警报,向管理员发送电子邮件。管理员确认触发的警报,以便让其他管理员知道正在处理此问题

在确认警报后,警报动作将停止,但确认时警报不会被清除或重置。您可以在vSphere客户端手动重置警报,以将警报恢复到正常状态。

预定义警报
您可以访问各种库存对象(如主机、虚拟机、数据存储、网络等)的许多预定义警报
你可以编辑预定义的警报或者你可以创建一个现有警报的副本然后修改需要的部分

除了用预定义的警报,你可以在vsphere 客户端创建自定义的警报
如果预定义的警报没有处理您想要监视的事件、状态或条件,则定义自定义警报定义,而不是修改预定义的警报。

定义警报目标类型
在名称和目标页面上,为警报命名,给出一个描述,并选择此警报监视的inventory对象的类型。
您可以为以下目标类型创建自定义警报:
•虚拟机
•主机、集群和数据中心
•数据存储和数据存储集群
•分布式交换机和分布式端口组
•vCenterserver

在常规页面上,您可以为警报命名、给出描述和警报类型。您还可以选择监视什么:
•特定条件或状态:基于条件的警报。您可以为虚拟机、主机和数据存储创建基于条件的警报。
•此对象上发生的特定事件:基于事件的警报。您可以为虚拟机、主机、集群、数据中心、数据存储、数据存储集群、网络、分布式虚拟交换机和分布式虚拟端口组创建基于事件的警报。
您还可以通过选择或取消选中“启用此警报”复选框,使用“常规”页启用或禁用警报。

报警触发

一个警报需要一个触发器:
•一个条件或状态触发器监控当前的条件或状态: 监视虚拟机、主机和数据存储的当前条件或状态。条件或状态包括电源状态、连接状态和性能指标,如CPU和磁盘使用情况。

-示例:
•虚拟机的当前快照大于2 GB。
•主机使用了其总内存的90%。
•数据存储从所有主机断开连接。

•事件触发监视事件: 监视库存或vCenter服务器系统中的托管对象在响应操作时发生的事件。例如,每次克隆、创建、删除、部署和迁移虚拟机(即托管对象)时都会记录一个事件
-示例
:•主机硬件的健康状态发生了变化。
•数据中心的许可证已经过期。
•主机离开了分布式交换机。

您可以选择并配置触发警报的事件、状态或条件
您必须为每个触发器创建单独的警报定义。在vSphere客户机中不支持OR操作符。但是,可以将多个条件触发器与AND操作符组合使用。

定义警报规则:设置通知
将通知方法配置为在触发警报时使用。这些方法可以发送电子邮件、发送SNMP陷阱或运行脚本。

您可以选择并配置事件、状态或条件来将警报重置为正常。
有时,就像本例中一样,您只能访问一个选项来重置警报。

在检查页面上,默认情况下启用了新的警报定义。
要配置电子邮件,请指定邮件服务器FQDN或IP地址和发件人帐户的电子邮件地址。

您最多可以配置四个SNMP陷阱的接收器。它们必须按数字顺序排列。每个SNMP陷阱都需要一个对应的主机名、端口和群体。