阿里云弹性计算核心技术解密LC3专场回顾

6月25日，由LFAsia, LLC主办的全球开源*盛会LinuxCon + ContainerCon + CloudOpen（LC3）在北京国家会议中心召开。来自国内外的开发人员、架构师、系统管理员、DevOps专家、商业领袖等数千名专业人士汇聚一堂。

阿里云研究员褚霸在大会当天同多位业界资深大咖同台时交流表示，阿里发展到今天，计算能力转化为普化的能力并且形成数据在云上，纵然极具挑战，但是也在不断增强阿里的技术能力，促进经验的积累。

阿里云ECS弹性计算作为计算能力的基础，今年做的最重要的2件事

第一，在芯片和软硬件一体化系统层面不断的挑战创新，比如我们推出的弹性裸金属服务器（神龙）以及自研异构计算高密度FPGA板卡AliFPGA等。第二，基于阿里云近些年在云原生领域积累的经验，产品创新的同时持续优化用户体验，在提升计算能力的同时驱动各行业真正的步入智能时代。

在备受业界关注的LC3会议飞天技术汇专场上，飞天技术专场：阿里云弹性计算核心技术解密专场内容颇为丰富，阿里云弹性计算团队分享了人工智能应用性能加速、热迁移、virtio-blk的加速qcache等议题，同时还对提升虚拟机性能提出了新的思考。

高级技术专家昀龙带来了人工智能服务极致加速的分享。通过不同的应用优化案例提出了若干针对AI场景的解决方案。例如，在一个CTR预估训练场景中，通过GPU分布式训练性能优化，性能大约可提升至原来的14倍。

技术专家张超分享了阿里云弹性计算高可靠性的技术保障之一：热迁移技术。通过热迁移技术，可以使虚拟机在保持运行状态的情况下，将其从一个物理宿主机迁移到另外一个物理宿主机，整个过程用户几乎无感。

高级工程师念卿全面分享了virtio-blk的加速qcache的相关内容。从kvm的存储背景栈，qcache的工作原理，qcache常见的使用模式，qcache的性能展示，到未来工作的思考等方面详细介绍了qcache。除了介绍qcache的基本工作原理外，念卿还介绍了qcache的两个特征，大量未命中请求处理以及seq-cut-off。其中，在大量请求未命中的场景，为了减少cache磁盘压力以及保持guest请求的响应速度，qcache会在未命中请求过多的时候采用PT的方式进行处理。而seq-cut-off特征提供了一种方法，使得可以自主调整是否缓存大块连续的请求。最后，会议介绍了qcache的未来发展方向，包括spdk，optane的支持，QOS的支持,cache size的动态分配以及开源。

高级技术专家哲杨则对典型业务场景在虚拟化场景下存在的性能问题进行了分析，并由此提出了一个新的技术解决方案。该方案通过在内核进行少量的修改，可以有效地降低虚拟化的开销，同时提升虚拟机的性能。在实际的业务测试场景中，通过该方案，可以有效提升大约20%的系统性能。

阿里云弹性计算核心技术解密LC3专场回顾

阿里云弹性计算核心技术解密LC3专场回顾

相关推荐