红帽集群(起搏器/ Corosync):DLM无法启动
问题描述:
我需要对我的集群错误的帮助:红帽集群(起搏器/ Corosync):DLM无法启动
[[email protected]]# pcs status
Cluster name: oracluster
Last updated: Mon Feb 22 16:00:12 2016
Last change: Mon Feb 22 15:45:14 2016
Stack: corosync
Current DC: db2 (2) - partition with quorum
Version: 1.1.12-a14efad
2 Nodes configured
5 Resources configured
Online: [ db1 db2 ]
Full list of resources:
ClusterVIP (ocf::heartbeat:IPaddr2): Started db2
Clone Set: dlm-clone [dlm]
Stopped: [ db1 db2 ]
Clone Set: clvmd-clone [clvmd]
Stopped: [ db1 db2 ]
Failed actions:
dlm_start_0 on db2 'not configured' (6): call=18, status=complete, exit-reason='none', last-rc-change='Mon Feb 22 15:57:04 2016', queued=0ms, exec=34ms
PCSD Status:
db1: Online
db2: Online
Daemon Status:
corosync: active/disabled
pacemaker: active/disabled
pcsd: active/enabled
详情:
我有2个节点(DB1,DB2)共享存储(SAN) 。这两个服务器都在RHEL7.1中。现在我想将存储添加为资源。根据RHEL文档,DLM和CLVMD也应作为资源添加。我发现启用STONITH时该错误将消失,但DLM尚未启动。日志说它需要配置Fencing Device,我现在没有。
任何解决此问题的方法?我们是否有办法禁用围栏机制,并使群集继续工作?提前感谢你!
答
配置SONITH。它会帮助你解决这个问题。
答
你说,你有SAN存储,然后创建了一个击剑和partion使用它作为SCSI STONITH,IL将解决你的问题,这样为例:
pcs stonith create scsi-stonith-device fence_scsi devices=/dev/mapper/fence pcmk_monitor_action=metadata pcmk_reboot_action=off pcmk_host_list="node1 node2" meta provides=unfencing
,不要忘记启用stonith与pcs property set stonith-enabled=true