12c rac环境磁盘问题导致集群异常的解决实例
rac环境中4节点集群异常,voting file无法正常读取
因为这个库之前出过一次磁盘权限导致磁盘无法读取的问题,所以我首先直接对比了4个几点的磁盘权限和用户所属组
发现4节点的oracle用户所属组比其他3个节点的所属组要少一个asmadmin
[[email protected] ~]$ id oracle
uid=1101(oracle) gid=1020(oinstall) groups=1020(oinstall),1022(asmdba),1024(dba),1025(oper),1026(backupdba),1027(dgdba),1028(kmdba)
对oracle添加asmadmin组
[[email protected] ~]$ usermod -a -G asmadmin oracle
然后重启集群,仍然异常。
对udev规则和multipath进行检查,发现4节点multipath状态如下
multipath状态为failed ready,其他3个节点都是active ready
重启multipathd
然后重启4节点集群
观察了crs日志为正在启动($ORACLE_BASE/diag/crs/host01/crs/trace)
稍等几分钟后集群状态正常