故障转移集群-1

应用于:Window server 2012 (R2)

群集的优势:
强烈建议看以下系列视频!!!
source:B站视频 故障转移群集的通用原理(Windows Linux都适用,1-4集,每集十几分钟)
https://www.bilibili.com/video/BV1Fa4y1Y7ie/?spm_id_from=333.788.videocard.4

  1. 可用性
    增加平均失效时间 MTTF mean time to failure
    减少平均恢复时间 MTTR mean time to recover
  • 如歌提高可用性?
    故障转移集群-1
    如何增加MTTF,服务器哪些组件可能会失效?网络?存储?操作系统?电力?
    如何解决这些故障?
  1. 可伸缩性
    可扩展性解决的问题就是:慢,服务器慢了,就加硬件,一颗CPU变两颗,i5变i7。
    scale up,向一个系欸但添加更多资源,内存、CPU、磁盘。但是对于硬件来说总是有天花板,所以就有scale out,增加多台节点(节点就是服务器)来分担负荷。
  2. 可管理性
    灾难恢复:集群帮助应用系统从灾难中进行恢复
    滚动更新,打补丁、修复操作系统、硬件调整,如果没有冗余、群集,系统就会有宕机时间,如果有群集就可以进行滚动更新,一个一个节点进行更新。

常规故障转移群集特性

  1. 只能将资源指派给单一节点
  2. 群集里面的节点数量可感知,添加节点或减少节点,群集也有所感知
  3. 群集中的节点也会感知到资源是运行在本地还是其他节点上
  4. 应用程序客户端和群集阶段可进行网络通讯

故障转移群集概述

故障转移集群-1
上图为典型的故障转移的拓扑结构。

  1. 里面有节点1,2(也就是有两台服务器1、2)

  2. 通过共享存储构建了基于共享存储的群集(群集的存储可以用共享模式和独立模式,共享模式使用于实时更新的场景,这样节点可以使用同一套存储,而不需要各个节点来进行更新同步,比如wiki这样的应用,会随时更新,共享存储会更适用)

  3. 两个节点之间需要某种机制来进行相互的状态感知,这个就叫做心跳网络。通过心跳网络机制,每个节点知道彼此的状态,一般常用以太网专用网络。

  4. 其次,故障转移群集于客户机的网络连接,计算节点和客户机通过局域网LAN的链路进行连接,进行连接的切换,若是负载平衡的场景,就可以同事访问多个节点。
    故障转移集群-1

  5. 群集化的服务和资源:在故障的时候,可以讲服务和节点转移到其他资源上,在一个时间点上,只能运行在一个节点上,当一个节点失效时,可以讲服务转移到另一个节点上,资源可以是:IP地址、存储、主机名、共享磁盘等等

  6. 故障转移群集使用的网络规划:
    公共网络:用来相应客户端请求
    私有网络:心跳网络,要考虑冗余
    存储网络:与外部存储系统网络,要考虑冗余

仲裁模式概念 Quorum

在故障转移群集中,仲裁定义足够的可用集群成员提供服务。
多个节点想同时写入时,如何分配优先级,防止磁盘损坏
仲裁:

  • 投票 vote
  • 根据不同仲裁模式,可使用节点,文件共享和共享磁盘用来投票
  • 足够的票数时,允许故障转移群集保持在线
    合法:
  • total_nodes<2*active_nodes

微软2012 仲裁机制很灵活,可以基于节点、文件共享、共享磁盘。
微软的仲裁模式:

  1. 节点多数模式,只有节点才有投票权,当超过半数节点在线时,才满足仲裁要求
    场景:比如说,有三个节点,节点1 宕机,群集还有两个在线,然后再坏一个节点2,那么三个节点都不工作。
  2. 节点和磁盘多数模式:群集中的节点和见证磁盘才有投票权,当超过半数的vote在线时才满足仲裁条件
  3. 群集中的节点和见证文件共享猜有投票全,也要求半数
  4. 非多数:进磁盘模式,只有仲裁共享磁盘才能进行投票,当共享磁盘在线时才满足仲裁要求(很少见)
    如果不够法定人数,整个群集都会宕机

默认情况下,如果群集节点是奇数,选择节点多数模式,如果节点是偶数,选择节点和磁盘多数模式。
异地灾备群集,推荐采用节点和共享文件夹的模式。

故障转移集群给很多服务器负载工作提供了高可用性和可扩展性,其中包括Exchange、Hyper-V、SQL、文件服务器。这些服务器应用可以在物理服务器上运行,也可以在虚拟机上运行。
本章要介绍的故障转移集群可以扩展到64分物理节点、8000个虚拟机。
应用场景:
5. 文件共享存储的高可用和持续可用,比如SQL和Hyper-V虚拟机
6. 物理机或虚拟机的高可用群集角色

硬件要求:
7. 故障转移集群的硬件组件必须满足windows server 2012的质量认证
8. 如果用共享存储,存储必须负载群集的节点上
9. 存储的设备管理器和相应的适配器可以是 serial attached SCSI,Fibre Channel, Fibre Channel over Ethernet (FcoE), or iSCSI.
10. 计算集群配置必须要通过配置向导的测试。

故障转移集群硬件需求和存储选项

创建故障转移集群