《VMware vCAT权威指南:成功构建云环境的核心技术和方法》一3.8 多站点考虑因素...

本节书摘来自华章出版社《VMware vCAT权威指南:成功构建云环境的核心技术和方法》一书中的第3章,第3.8节,作(美)VMware vCAT 团队,更多章节内容可以访问云栖社区“华章计算机”公众号查看

3.8 多站点考虑因素

vCloud Director初始部署针对的是传统的测试和开发、扩大的基础架构和通常不需要高级基础架构特性的第3层工作负载。随着客户开始采用vCloud Director处理不同的工作负载,产生了一组新的需求。其中之一是部署vCloud Director,管理跨越一个以上网站的资源。
多站点混合vCloud情景(定义为私有和公共云资源的组合)在此不做讨论。
本小节为在专注于特定vCloud分布模式的分布式方案中部署vCloud Director提供指导,并讨论各种选项、局限和支持的场景。目标是对一个私有或者公共vCloud实例,描述将其延伸到多个位置的选项;这种模型采用具有两个或者更多vCloud Director单元的单一vCloud Director实例,确定不同的组件如何在不同位置单独部署。从vCloud Director的角度,这考虑的是单个vCloud。图3.44说明了这一概念。
附加模型使企业客户和服务提供者可以创建跨越多个远程站点的单一vCloud。替代模型之一是在每个可用位置部署传统的vCloud Director实例,并在它们之上设置一个附加的管理层次,为分散的vCloud实例提供单一入口点。这种附加层次可以用附加的软件层(如VMware vCloud Automation Center)实现。图3.45说明了这一概念。
 
《VMware vCAT权威指南:成功构建云环境的核心技术和方法》一3.8 多站点考虑因素...

3.8.1 多站点可用性考虑因素

许多不同的分布式方案可以使vCloud容量散布到世界各地的不同场所。有些分布式设计选项可以带来弹性上的好处。其他选择可能是DR方案的先决条件(但是,这些选择更多的是计算机运算群(Computer Farm)分布的必然结果,而不是明确设计目标所引起的)。
创建分布式vCloud模型是必要的基础,但是不足以解决vCloud工作负载的高可用性和灾难恢复问题。本节的重点是如何分布资源,而不是如何使工作负载在这些资源上实现高可用性。

3.8.2 分布式云部署用例

下面是vCloud跨越多个位置的一些主要用例(可能还有其他用例)。
分布式资源的更好和更统一使用及管理:许多客户和服务提供者希望构建包含分布到不同城市、国家和大陆的资源的单一vCloud。这是他们的IT运营方式。他们更喜欢运营一个现成的vCloud,而不是构建两个或者更多需要附加集成工作的vCloud实例。
第二个用例类似于第一个,但是业务推动因素不同。尽管许多客户和服务提供者分布资源是因为那更像全球性公司的运营方式,但是在某些情况下,服务提供者将资源分布到不同的国家和地理位置是必需的,这是因为数据管理规定和合规性的要求,也可能是因为他们的客户无法将资产带出某些国家或者地理位置。在这种情况下,服务提供者必须分布在销售它们的服务的位置。这些服务提供者希望在同一个vCloud伞形结构下管理数据中心。
第三个用例是前两个用例的变种,专门针对服务提供者。许多服务提供者对向用户提供在共享管理平台上集中管理,但是在客户场地交付的vCloud服务感兴趣,这种服务在客户的场地上部署专用的物理环境。提供这种服务有各种原因,覆盖了从安全性和合规性到网络需求的范围。想象一下客户订阅公共vCloud服务,服务提供者将整个提供者虚拟数据中心分配给该组织,提供者虚拟数据中心又恰好部署在客户场地的情况。
第四个用例涉及公共或者私有服务提供者的vCloud客户分布在全球,且希望保证最低的延迟和最好的体验。实现这一目标的最佳途径是将用户工作负载和运行的系统在物理上尽可能靠近客户。这些服务提供者也希望将这些资源当成单一vCloud来管理。
第五个用例是提供一个机制,允许用户消费物理上分布在不同位置的资源,以增强弹性。当最终用户工作负载的弹性在应用程序级别上管理时,最终用户可以在分布到远程位置的独立提供者虚拟数据中心实例化松散耦合的虚拟机,从而实现可伸缩性和弹性。在这种情况下,最终用户负责管理应用程序的弹性。
第六个用例使vCloud提供者能够在工作负载发起的数据中心出现故障时,将它们负载故障切换到不同站点,从而增强最终用户工作负载的弹性。在这种情况下,应用程序弹性通过在基础架构级别(而不是应用程序级别)上实现的恢复机制达成。这是vCloud管理员向最终用户提供的弹性服务,与应用程序弹性无关。
本小节重点描述将不同位置的独立计算资源延伸到单一vCloud控制下的不同选择。

3.8.3 多站点术语学

本小节使用如下术语。
分布式vCloud:将vCloud资源和组件分散到不同位置的一般性概念。
位置:vCloud组件部署的物理位置、建筑物和具有LAN连接性的整个物理数据中心。
单站点vCloud:跨越用MAN连接性连接的一个或者多个位置的vCloud。
多站点vCloud:跨越用WAN连接性连接的一个或者多个位置的vCloud。
图3.46展示了分布式vCloud部署选项。

《VMware vCAT权威指南:成功构建云环境的核心技术和方法》一3.8 多站点考虑因素...

历史上,vCloud Director部署只在单一站点或者单一位置中得到支持。然而,这一陈述可能造成一些混乱,因为它不是非常确定。实际上,在大公司中的不同位置间建立连接性优于在小型组织中单一站点建立连接性的情况也并不少见。
因此,上述陈述可以用更确定性的方法澄清。单一站点可以看作任何部署组件之间的连接延迟时间(RTT)为20毫秒(或者更少)的本地或者分布式IT部署。
这并不是提出带宽需求,因为带宽更多的是最终用户体验角度的问题,而非功能角度的问题。我们假定MAN方案中的带宽就足以避免连接性问题。但是,我们意识到,根据vCloud的使用模式,相对低的带宽可能给用户带来更高的响应时间。vCloud架构师负责根据期望的结果和计划的使用模式进行规划。
这些网络特性被称作MAN连接性。单站点部署是在一个或者多个位置托管所有vCloud Director组件,在这个位置或者多个位置之间的RTT连接性指标低于20毫秒。
如果vCloud Director部署的所有组件都具有这些连接特性,它就被看作单站点,该部署受到完全的支持。
如果分布式vCloud Director部署的组件中有些不具备这种连接特性,它就是多站点部署方式。

3.8.4 部署选项

vCloud平台能以无限种方式分布。这是因为必须部署的vCloud组件数量众多,连接性选项也多种多样。
下列选项会造成不同的组合和布局:
位置之间的连接性(MAN/WAN)
网络层(第2层/第3层)
最终用户工作负载群集配置(延伸/独立)
有些选项的组合可能不可行。例如,vSphere延伸群集配置只能部署在具有第2层延伸网络上。
图3.47展示了本节后面将要介绍的方案。

《VMware vCAT权威指南:成功构建云环境的核心技术和方法》一3.8 多站点考虑因素...

表3.17用略有不同的视图展示了上述选项。
《VMware vCAT权威指南:成功构建云环境的核心技术和方法》一3.8 多站点考虑因素...

《VMware vCAT权威指南:成功构建云环境的核心技术和方法》一3.8 多站点考虑因素...
《VMware vCAT权威指南:成功构建云环境的核心技术和方法》一3.8 多站点考虑因素...
《VMware vCAT权威指南:成功构建云环境的核心技术和方法》一3.8 多站点考虑因素...
《VMware vCAT权威指南:成功构建云环境的核心技术和方法》一3.8 多站点考虑因素...

尽管框图显示两个vCenter Server管理两个不同的群集,同样的概念也适用于单个vCenter管理两个群集的情况。为了方便起见。vCenter Server总是显示在vCloud Director单元附近,远离ESXi主机。在vCenter Server靠近ESXi主机,远离vCloud Director单元时,也适用同样的可支持性考虑因素。

3.8.5 单站点部署的可支持性考虑因素

VMware支持MAN方案中的vCloud Directore 5.1(正如3.8.3小节所描述的)。下面是一些可执行考虑因素:
所有提供者工作负载(除了vCenter Server和vCloud Networking and Security Manager实例外),都必须部署在单一位置。
如果不同位置之间的连接性满足3.8.3小节描述的延迟要求,群集支持的提供者虚拟数据中心可以部署在不同位置。必须将分隔提供者工作负载的数据中心之间的路径故障可能性降到最低。
管理和服务处于分布式位置中的群集的vCenter Server和vCloud Networking and Security Manager实例可以部署在靠近vCloud Director核心组件(vCloud Director单元和vCloud Director数据库)或者靠近所管理的群集的位置。
要实现跨越不同位置的单站点vCloud,架构师应该在部署各种组件时考虑vApp复制等敏感操作,使部署得到完全优化,而且,即使在MAN方案中,架构也要考虑可能存在的网络阻塞点(特别是带宽),和可支持性相比,这与优化的关系更大。
使用本节提供的存储供应商无关指南实现时,延伸群集(包括延伸的vSphere DRS群集和延伸的存储)得到了完整的支持。延伸群集(需要10毫秒或者更低的延迟)可以在租户和提供者工作负载布局中都得到更多的灵活性。
本节中的单站点通用考虑因素适用于延迟在20毫秒之内的租户部署。租户工作负载所用的延伸群集只在站点具有5毫秒或者10毫秒以内的延迟时才支持(取决于vSphere版本和所用的底层存储技术)。在5毫秒或者10毫秒的延迟下(取决于vSphere版本和所用的底层存储技术),提供者基础架构组件的位置更为灵活,建议你这样进行:
对于任何单站点部署,遵循20毫秒以内延时的原则。
对于在vSphere延伸群集之上进行的vCloud Director部署,遵循10毫秒以内的特殊建议原则(这些方法由支持延伸群集的底层存储解决方案决定,可能覆盖本章中的供应商无关延伸群集推荐方法)。
更多信息参见VMware vCloud博客文章《Stretched vCloud Director Infrastructure》(http://blog.vmware.com/vcloud/2013/01/stretched-vcloud-director-infrastructure.html)。

3.8.6 多站点可支持性考虑

VMware目前不支持多站点场景下的分布式vCloud Director 5.1部署。实例化跨越WAN的提供者虚拟数据中心是不可能的(正如3.8.3小节中的描述)。
图3.52总结了可支持性选项以及相关的限制和需求。

《VMware vCAT权威指南:成功构建云环境的核心技术和方法》一3.8 多站点考虑因素...