openstack nova 组件对instance实例的操作
常规操作
- Resize:通过应用不同的flavor调整分配给instance的资源
- Lock/Unlock:防止对instance的误操作
- Pause/Suspend
Pause:将instance的运行状态保存在计算节点的内存中,Suspend:将其运行状态保存在磁盘上,重启节点后还能恢复,pause重启节点后就不能恢复了,但是Pause的Resume的速度快。 - Snapshot:备份instance到Glance, 用于故障恢复
故障处理
计划内故障处理
- 计划内是指提前安排的时间内做的维护工作,服务器定期升级,硬件升级更换等
- Migration: 将instance迁移到其他计算节点, 迁移之前,instance会被shut off 支持共享存储和非共享存储
- Live Migration :与Migration不同的是支持不停机的在线迁移,保证业务的连续性,同样支持共享和非共享
- Shelve/Unshelve: Shelve将instance保存到Glance上,之后通过Unshelve重新部署,Shelve操作成功后,instance会从原来的节点上删除。Unshelve会重新选择节点部署,可能不是原来节点。
计划外故障处理
- 计划外是指突发情况,强行关机,断电,OS系统文件损坏,服务器掉电, 硬件故障等。同时又分为instance故障和计算节点故障
Instance故障
- Instance故障只限于一个Instance的操作系统层面,系统无法正常启动
- Rescue/Unrescue: 用于指定的启动盘启动,进入Rescue模式,修复受损对的系统盘,成功修复后,通过Unrescue正常启动instance.
- Rebuild: 如果Rescue无法修复,则只能通过Rebuild从已有的备份中恢复,Instance的备份是通过shanshot创建的,所以需要定时备份。
计算节点故障
- 计算节点发生故障,openstack则无法与节点的nova-compute通信,其上运行的所有的instance都会受到影响,这种情况只能通过Evacuate操作在其他正常的节点上重建instance
- Evacuate: 利用共享存储上的instance 的镜像文件在其他计算节点重建instance,需要提前规划共享存储。