vSAN6.2 性能服务

点击阅读原文

许多经验丰富的vSAN管理员都会知道我们在多大程度上依赖vSAN Observer来了解VSAN的基本性能。尽管vSAN Observer是一个非常强大的工具,但确实存在一些缺点。一方面,它不提供历史性能数据,只是提供当前系统状态的实时视图。vSAN Observer还是一个单独的工具,并且未与vSphere Web Client集成,因此没有系统的“单一面板”视图。

该工具也很复杂,提供了很多参数,这些参数是工程级别的指标,并不是客户真正需要的。由于该工具是通过RVC,Ruby vSphere Console启动的,并且RVC通常位于vCenter Server上,因此它也对vCenter Server产生影响。考虑到这些限制,VSAN 6.2引入了一项新服务,以帮助管理员详细了解VSAN性能,而没有此处概述的限制。

这个新的性能服务提供以下功能:

1. 与vSphere Web Client集成

首先要说明的是,新的Performance Service可通过vSphere Web Client完全使用。无需登录到RVC,也无需手动启动服务。一旦服务被管理员启用一次,它就一直处于打开状态。在vCenterServer清单中选择群集,主机或VM时,可以在“性能”>“监视器”视图下找到性能服务的所有图表。

vSAN6.2 性能服务

2. 简化指标:

性能服务显示的指标数量明显少于vSAN Observer显示的指标数量。然而,对于管理员来说,现在显示的度量更容易使用。选择集群,主机或虚拟机性能视图后,管理员可以选择显示虚拟机消耗量或vSAN后端消耗量。例如,如果检查了具有Raid1配置的VM,会在VM视图中看到500个写操作,但是由于VMDK是镜像设置,因此后端将有1000个写操作,每个副本有500个写操作。

这些视图中显示的指标包括吞吐量,延迟,拥塞和未完成IO。

主机视图还为磁盘组和磁盘提供了一些其他指标。磁盘组视图具有诸如读取缓存命中率(仅与混合vSAN相关)、逐出、写入缓冲区可用百分比以及许多其他有用的计数器等指标。

VM视图将为每个VMDK提供管理员指标,包括VSCSI IOPS,吞吐量和延迟。如果不确定某个特定指标,我们将为每个指标提供“工具提示”,您可以单击(i以获得信息),这将为您提供有关实际指标及其收集内容的更多信息。还提供了AskVMware链接,以获取更多信息。
vSAN6.2 性能服务

显示的指标是我们认为是vSAN管理员最常使用的指标。

3. 分布式架构:

性能服务的设计目标之一是确保对vCenter Server没有性能影响。因此,性能服务旨在利用vSAN的分布式体系结构。性能统计信息存储在统计信息数据库中,启用性能服务后,该数据库将作为对象部署在VSAN数据存储上。群集中的每个主机都会选择一个主服务器来更新统计数据库,并且当群集中的一台主机被选举为该角色时,所有其他ESXi主机会将其统计信息发送到该主机,以保留在统计数据库中。统计数据是5分钟内的平均值。然后,当图形用户界面中呈现图形时,Web客户端会查询统计数据库。

另一个设计目标是不依赖vCenter Server。因此,如果vCenter Server发生问题,并且需要部署新的vCenter Server,则将继续捕获性能统计信息以供将来参考。

4. 无单点故障:

我们已经提到过,统计数据库是在vSAN数据存储上创建的。因此,它可能具有与之关联的VM存储策略以实现高可用性。启用性能服务后,将要求管理员为stats DB对象选择策略。默认情况下,将选择默认的vSAN策略,该策略提供的“允许的故障数” =1。因此,即使主机发生故障,统计信息收集也将继续。
vSAN6.2 性能服务

还通过运行状况检查系统检查stats DB和Performance Service的状态,因此如果该服务有任何问题,将向管理员发出警报。这是在群集中引入脑裂时的示例:
vSAN6.2 性能服务

5. 提供历史信息

最后要说的是,新的性能服务克服了vSAN Observer中的严重限制,即查看历史数据的能力。默认情况下,性能服务会查看最后1小时的数据,但是可以更改此时间。
vSAN6.2 性能服务

如果希望查看特定的时间段,可以将时间范围更改为自定义,如下所示:
vSAN6.2 性能服务

可以选择要查看的特定时间范围。

这应该能让您对VSAN 6.2中的新性能服务有一个大致的了解。虽然vSAN Observer仍然可以通过RVC访问,但我们认为这项新服务应该可以解答在VSAN上可能遇到的绝大多数性能查询。

vSAN6.2 性能服务