SAP HANA数据库双机架构运维概念

本文主要参考《华为HANA一体机安装指南》,硬件相关功能也与华为HANA一体机紧密相连。

 

关于Scale UP 和 HANA Replication  向上扩展的架构

The first set of scenarios include the architecture and development of scale-up solutions. For this
scenarios SUSE developed the scale-up resource agent package SAPHanaSR .

System replication will help to replicate the database data from one computer to another computer in order to compensate for database failures (single-box replication).

scale-up 架构是第一主流的,为这个架构,suse 开发了专门的工具包 SAPHanaSR,对应于HANA数据库系统的Replication复制模式。(一台数据库的数据复制到另一台中,来避免单点故障) 

 

一、备节点异常后,如何恢复:
HA集群的服务器,如果备节点服务器异常重启,不会影响主节点数据库状态;备节点服务器重启之后,集群检测到备节点在重启之前已经注册到主节点,集群会自动把备节点数据库启动,无须人工启动数据库。

 

二、主节点故障后,HA的正确的切换流程是:
1、主节点数据库关闭或服务器重启->
2、备节点自动takeover->
3、OS层HA软件获取数据库主备状态变化->
4、OS层HA软件Master&Slave资源发生切换->
5、VIP漂移到切换后的节点。

 

三、发生主备切换后,如何恢复:

注意:

HA集群备节点node2数据库takeover接管之后,备节点node2会变为primary模式,主节点node1依然保持为primary模式。在主节点node1故障排除后,如果将原主节点作为备节点加入到HA集群,需要在切换前的主节点执行注册命令,注册到发生切换后的主节点。对于HANA数据库,本机作为备机注册到主节点后,本机的原数据会丢失,将会同步主节点的数据。所以在执行注册之前需确保当前主节点的数据是完整的。

操作:

步骤1 root用户登录到切换前的原主节点服务器node1。
步骤2 在node1执行su - <sid>adm切换到数据库账户。
步骤3 停止node1数据库,或确保当前HDB数据库停止。
步骤4 在node1执行注册命令,注册到node2。
步骤5 清理资源failcount ,SLES和RHEL系统清理资源failcount方法不一样。


● 对于SLES OS,登录Hawk界面,在SAPHana资源“openrations”中选择 “cleanup”清理该资源的故障计数。
华为 SAP HANA 一体机及HA 维护指南5 SAP HANA 双机HA 常见维护操作

SAP HANA数据库双机架构运维概念
● 对于RHEL OS,执行“pcs resource cleanup rsc_SAPHana_S00_HDB00”,其中S00是本例SID,请用实际SID代替。


步骤6 注册完成之后,HAE资源会检测备节点已经注册成功,HAE资源自动把备节点数据库启动。

 

我的第一次HANA主备切换操作:

1、使用HA脚本查看数据复制状态,确保备节点“sync_state”是“SOK”,同时主备节点score都是正数:
SAPHanaSR-showAttr

SAP HANA数据库双机架构运维概念

2、使用HANA数据库脚本查看数据复制状态,确保所有HANA进程Replication Status都是“ACTIVE”:

# su - <sid>adm
> cdpy
> python systemReplicationStatus.py

SAP HANA数据库双机架构运维概念

 

3、主节点上 HDB stop

SAP HANA数据库双机架构运维概念

4、新主节点上注册备机

hdbnsutil -sr_register --remoteHost=hanaprd02 --remoteInstance=00 --replicationMode=sync --name=hanaprd02 --operationMode=logreplay

5、清资源

crm resource cleanup rsc_SAPHana_HEP_HDB00