华为云HCIE关键笔记-计算虚拟化2

      一、CPU的Qos

      因为存在cpu超分配(也应是复用率大于100%)的情况,必然存在虚机之间争抢资源的情况,因此有必要制定Qos策略,以保证部分重要业务可以顺利执行、普通业务至少有最低保障。Qos有三个指标:

      1、CPU资源限额

      控制某虚机的最大使用CPU物理资源的上限,避免某些恶意程序将资源全部耗尽。

      2、CPU资源预留

      当多个虚机在竞争物理CPU资源时,分配的最低CPU资源。

      3、CPU资源份额

      多个虚机在竞争物理CPU资源时,按比例分配CPU资源。

 

      举例如下:

华为云HCIE关键笔记-计算虚拟化2

      二、内存资源的复用(超分配)

      1、内存可以超分配。在云环境中,内存资源是可以超分配的,而且最高不建议超分配超过150%。超过这个临界点,客户将会感知到使用体验的变化。

华为云HCIE关键笔记-计算虚拟化2

      2、如何实现内存超分配?

      内存共享:虚机间共享同一个物理内存,此时该物理内存仅能作为读使用,或者是该区域是未用的(蓝色);如果需要写,就为每台虚机新分配一个空间(红色)。举个形象的例子:群租的3个朋友,共用客户(只能看着,但不能放个人物品),而个人有自己的卧室(可以放置个人物品)。

      内存置换:这个好理解,将长时间未使用的内存数据放到硬盘中。因此用户会感知到慢。

      内存气泡:将内存利用率低的虚机资源换给内存利用率高的虚机。举个形象的例子:群租的3个朋友,一个朋友租了较大的卧室,但经常几个月出差,未使用,我们就将经常在家的朋友换到这间卧室居住。感觉有点不人道。:)

华为云HCIE关键笔记-计算虚拟化2

 

      3、注意事项

      内存复用是集群特性:在集群cluster中开启内存复用功能,非不是某一台物理机的特性。举例:如果是一台物理机的特性,某一台开启了内存复用功能的物理机down,冷迁移至一台新的物理机,也应有同样的内存复用功能才能满足业务需求。集群是一个管理的组,如物理机down,只能迁移至同一个集群中的另一个物理机中,不能跨集群迁移。

      内存复用与NUMA特性冲突:NUMA是在BIOS中开启的特性,要求某CPU只能使用与其对应用内存,以保证最快的速度。而内存复用的气泡特性是可以借用其它虚机的内存,与该特性冲突。

华为云HCIE关键笔记-计算虚拟化2

      三、虚拟机热迁移

      热迁移对用户的影响很短:热迁移的中断时间很短,不超过1秒种,用户业务基本可以做到无感觉。热迁移的要求:内存数据也要进行跨物理机迁移,磁盘文件必须基于共享存储。应用场景:一般是用于管理员根据负载情况进行业务的动态调整,华为的DRS功能就是自动实现业务均衡迁移的。

      内存数据的迁移技术描述:首先将正常工作的内存数据冻结,再新开辟一块新内存空间仅用于写增量数据,同步将冻结的内存数据copy至新的物理机,再将新开辟的新内存空间数据与冻结的内存融合,最后解冻。这只是大概原理,实际会有多次的循环,因为迁移新内存空间过程中,又有新的数据写入,只有不断的执行循环,直至内存数据全部copy完成。

华为云HCIE关键笔记-计算虚拟化2

      冷迁移会中断几分钟时间:冷迁移内存中的数据无法保存,因此迁移后会进行虚机的重启,用户会感知到业务在几分钟的中断(也就是虚机操作系统、应用程序重启的时间)。冷迁移适用于物理机故障,而将虚机业务迁移至新物理机的场景。

 

      四、存储热迁移

      当云环境使用了一个共享存储设备(如FC-SAN),当容量不够,再新增一个共享存储设备时,就涉及到存储容量的调整均衡。

      操作办法是:先将第一个共享存储,分为若干个存储块,当copy第一个块时,将其lock起来,再copy至新的存储设备中。当完成第一个块的数据copy后,以后对该存储块的写操作,由上层操作指令要求同步写入新旧两个存储设备中,以保证数据的同步,直至数据全部copy完,再删除旧存储设备的数据。

华为云HCIE关键笔记-计算虚拟化2

更多内容实时更新,请访问公众号。    华为云HCIE关键笔记-计算虚拟化2