记一次XenServer灾难恢复

记一次XenServer灾难恢复

一、前奏

现象:

记一次XenServer灾难恢复

总共64G内存,Dom0占用了48G内存。。。。

有问题

没运行的虚拟机一台也起不了。。。

有的启动自动宕机

一部分报internal error

一部分报 ;nested Exception is There was an SR backend failure.;nested Exception is There was an SR backend failure.

操作:三台机器 df 空间都100%了,需要清日志文件了

清完继续观察

Fcsk查盘。。。

。。。。。。。。。

gd001,gd003,没问题了,gd002 还是有问题

Df 我靠 空间由4G变成16T了,而且100%,

我总共磁盘空间也没那么大。。。。什么鬼

cd /   ls -l 没东西???误删了???

重启。。。

没了。。。机器没了。。。机器重启动不了没了。。。。。

二、重装

联系机房

第二天

进机房  启动过程报

missing OS。。。。missing OS。。。。missing OS。。。。

咨询,没碰过这问题,建议:1.RAID是否有问题了 2.重装软件

RAID看了半天,感觉没啥问题(三个小时)

看来只能重装了。。。。。。

安装准备:

XenServer-6.2.0-install-cd.iso

http://downloadns.citrix.com.edgesuite.net/7281/XenServer-6.2.0-install-cd.iso

 

特殊安装教程(保留数据):不选本地存储,其他正常安装

https://jingyan.baidu.com/article/148a1921e6770d4d71c3b1b3.html

一定要保留数据呀,要不我的10多台虚拟机就没了。。。

刻盘  小插曲 刻废3张

安装过程 略

启动。。。。。。。全新的XENserver起来了。

三、找回数据

教程:https://blog.****.net/ZebraChroma/article/details/85046999

Pvscan

啥也没有。。。。。

麻爪ing。。。。。。什么鬼!!!

ls -l /dev/disk/by-id/

为什么我没有sda3分区。。。。为什么。。。。为什么。。。。。

继续翻帖。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。(200遍)

救星:https://www.iamhippo.com/2015-06/173.html

要点:自己用gdisk创建sda3

纠结ing,建不建分区,建错了怎么办(冒着数据彻底没了的风险)。。。。。。(睡觉,明天再说)

第二天

检查gd001的分区,哈哈,应该和gd002一样,有戏,参数都一样就应该好使

学习gdisk用法

就这么干了

建分区

重启 (折磨人的5分钟)

Pvscan

他来了,他来了,他脚踏祥云进来了(此处应有BGM)

ls -l /dev/disk/by-id/

Sda3分区有了(松了一大口气,东西应该都在)

按照教程操作  (略)

安装XENcenter

四、重建VPS

目标:自己创建一个个VPS,一个个硬盘挂载回去,找回数据。

途径:使用XENcenter

教程:http://anyways.lofter.com/post/8287e_2b6cfa

不一样的地方,我的每块硬盘的名字都在。

每个硬盘对应建一个VPS,走起,18块硬盘18台VPS。。。。。

。。。。。。

。。。。。。

碰到的几个问题:

1.centos系统需要选择模板建立VPS,按Other install media方式建的挂硬盘后启不来。。。。启不来。。。。启不来。。。。

2.Centos模板方式建立的VPS(换硬盘后),不能光盘启动了

VPS的PV模式和HVM模式问题

参考:https://www.jianshu.com/p/a5e10539926b

我的解决方法:用Other install media方式建一个VPS挂硬盘然后光盘启动。

3.Centos的网卡MAC要与原来安装的一致

用光盘启动 rescue模式,进到硬盘找到/etc/sysconfig/ network-scripts/ifc-eth0 找到网卡MAC,写到 VPS的网络设备的MAC。

4.Centos机器启动后自动宕机(诡异问题)

三台centos启动后,隔一段时间自动宕机(两台Oracle,一台Mysql)

(纠结,麻爪,无所适从)

紧盯console

一遍。。。一遍。。。一遍。。。一遍。。。一遍。。。

报错了

记一次XenServer灾难恢复

Core?奥,不对,是cron  定时任务报错。。。。。

光盘启动rescue,

chroot  

crontab -e

记一次XenServer灾难恢复

那里出来的5条,还带reboot

注释掉

正常启动

起来了,好使了

第二台,一样操作,好使了

第三台,一样操作,好使了

5.启动不了的硬盘千万先别删,很可能是别的机器挂的扩展硬盘。

6.你可能会找回一些老古董机器(以前删除的VPS没删硬盘)。

五、思考

应该是开始系统的分区全部丢失了,(fsck搞的鬼???没想明白)

重装,自动新建了前两个分区,数据分区没给建

六、彩蛋

cd里的client_install什么东东

安装

XENcenter (好像可以替代。。。)

他真的能替代。。。

我靠,这是真的,不用去刷脸求授权码了