云网络十年:探路者阿里云的理想和坚持

云网络十年:探路者阿里云的理想和坚持

 

凌云时刻 · 故事

云网络十年:探路者阿里云的理想和坚持

云网络十年:探路者阿里云的理想和坚持

导读:所谓云网络,就是把网络真正虚拟化,变成一个具备超高弹性、超强灵活性和超大规模的面向租户和应用的网络。

受访者 | 祝顺民、吴天议

前言

云网络十年:探路者阿里云的理想和坚持

近日,阿里巴巴发布强劲财季业绩后,高盛、摩根大通等多家机构上调阿里云估值至千亿美元以上,其中高盛上调阿里云估值至 1238 亿美元。今年上半年阿里云营收达 245 亿元,市场份额连续四个季度上涨,给市场注入强劲信心。

阿里云的飞速发展,也映射了整个云计算产业的发展,经过将近二十年的发展,云计算已经从一个鲜为人知的专业术语变成了几乎家喻户晓的名词,而云计算产业也持续保持高速增长,据全球知名市场研究机构 Gartner 分析显示,云计算已经成为增长最快的科技领域,增长速度高达 25%,而整体 IT 市场的增长率仅为 1.1%,云计算增长速度是整个 IT 市场的 25 倍。未来,越来越多的企业将会向云端迁移,享受云计算给他们带来的红利。

目前,企业上云普遍使用的是计算,存储,网络等 IaaS 层产品线的产品。其中,计算产品线的云服务器 ECS 是大多数人最熟悉的,而阿里云网络产品线经过这几年快速发展,目前已经有近 20 个产品,大家对其中一些产品相对不那么熟悉,对于云网络也不是很了解。为此,在云网络 10 年之际,阿里云智能研究员祝顺民和阿里云资深产品专家吴天议谈了谈他们眼中的云网络。

云网络的本质是服务

云网络十年:探路者阿里云的理想和坚持

什么是云网络呢?祝顺民表示,云网络的本质有两点:

第一是以云为中心。云网络被定义成一个数字经济体的连接,它的内涵是一个面向应用和租户的虚拟化网络基础设施,它具备云的特征,即按需、弹性、随处可获得、可计量。

第二是面向租户与应用的虚拟化。云网络可以把网络设备虚拟,并通过服务的方式提供给多个用户使用,同时又具有极致性能。

祝顺民强调,云网络更像是一种服务。如果把云计算比喻为一个电厂,云网络实际是连接各个电厂的电网,所以它不仅仅是服务于云计算中的数据中心,同时也连接各种终端、个人、企业。

吴天议介绍,计算正在从以算法为中心演进为以数据为中心,面对这样的变化,未来的网络将以“持续降低单比特的成本”为目标,通过提升带宽利用率,云原生重构网络设备,使得数据传输成本大幅降低,从而降低 Capex。另外,通过 AI OPS 实现网络运营服务化,从而降低 Opex。谈到云和网的关系,未来应该是云网一体。云网一体一方面是以云为中心无缝连接 “云—管—边—端“,另一方面对应用来说,对云和网的感知是无差异的,是一体的。当然,云网一体未来到底会呈现出怎样的特性目前还不是很明确,还需要持续的演进。而所谓云网络,就是把网络真正虚拟化,变成一个具备超高弹性、超强灵活性和超大规模的面向租户和应用的网络。

云网络十年:探路者阿里云的理想和坚持

云网络的演进之路

云网络十年:探路者阿里云的理想和坚持

吴天议介绍,就像许多新技术新概念一样,云网络的技术和概念也不是一蹴而就的,它也是伴随着互联网和云计算的发展逐步演进,最终慢慢形成、成熟并被大家所熟悉和认可的。

2010 年以来,互联网获得了快速发展,很多互联网企业上云,通过云实现了计算的虚拟化,那时候对云网络的主要需求是公网接入能力。在这个阶段阿里云通过 Classic 经典网络对云计算用户提供支持。用户通过 ECS 上的公网 IP 和负载均衡产品来提供公网访问服务,这是云网络早期的产品。

到 2014 年,随着 4G 网络带来移动互联网发展,尤其是媒体、社交应用的发展,这些 ToC 业务需要解决同时接入多运营商问题。此外,随着更多的企业选择将应用搬迁上云,企业对云上网络安全隔离能力和互访能力、企业数据中心与云上网络互联,构建混合云的能力,以及在云上多地域部署业务后的多地域网络互联能力都提出了很多的需求,而这些需求在 Classic 经典网络架构下都力不从心,于是,阿里云开启了云网络 1.0,面向租户的云网络的创新之旅。2014 年,阿里云 VPC 产品上线, 实现了企业数据中心网络虚拟化,VPC 中支持虚拟交换机,虚拟路由器;租户可独享 SLB 服务,可通过 NAT/EIP 主动访问公网;通过 v*n,高速通道建立企业到云上的网络互联。

随着大数据与 AI 应用风起云涌,互联网线上/线下融合蔚然成风,企业出海方兴未艾。为了更好满足企业智能化,全球化的需求,阿里云开启云网络 2.0 产品与技术架构升级;2017 年推出云上跨地域网络互联产品云企业网 CEN。云网络开始走出数据中心网络,把云上数据中心之间,云上数据中心和云下 IDC 之间联通起来,这标志着云网络技术应用到整个阿里云的核心网络之中。2018 年,阿里云进一步把用户上云的混合云网络也采用了云网络技术进行了改造,推出了智能接入网关 SAG。云网络与容器网络进行融合,构建云原生应用层网络;云网络团队用十年的时间将云网络的技术和产品体系切实落地,云网络的概念慢慢形成。

云网络十年:探路者阿里云的理想和坚持

祝顺民接着谈到了云网络中具体技术的发展,他表示,产品层面来看,从云网络 1.0 到 2.0,云网络的范围得到了延展。横向从以前聚焦数据中心,进化到聚焦数据中心之间互联;更进一步的,甚至将企业的接入网也进行了虚拟化,这样,企业不仅不需要构建自己的核心网络,连接入网络的建设也省去了。纵向看,云网络产品不仅连接计算/存储,线下逐渐发展到连接企业的总部/分支与各种移动终端,线上企业可连接阿里云服务,阿里巴巴经济体应用,构建企业间服务生态。

云网络从核心技术来看,是对网络编址和网络性能的优化。云网络 1.0 在编址上,使用 Overlay 技术,就是将很多块数据一起打包,即在物理网络之上叠加了一个租户的虚拟层,从而一次将多块数据一起运到正确的地址,从而提高网络的效率。在网络性能上,通过云原生重构网络设备形态持续提升数据转发性能:以虚拟交换机为例,服务器从 10G 升级到了 25G,再到 100G,经历了经典网络的 Linux 内核交换机、云网络 1.0DPDK 交换机、云网络 2.0 物理网卡交换机。

洛神是何方神圣?

云网络十年:探路者阿里云的理想和坚持

洛神是阿里云网络的核心平台,伴随阿里“飞天”系统诞生的,是全自研的核心系统。为什么叫洛神呢?洛神的意思是洛河之神。在古代,河运是非常重要非常快速的交通手段,河网非常重要,就好比今天的网络一样重要,因此,在给云网络系统起名的时候就想,应该起一个河神的名字,因此就使用了洛神这个名字。

“洛神”作为是阿里云飞天操作系统的网络子系统,一方面通过实现网络虚拟化,对用户提供网络产品和服务。另一方面,作为底层技术系统,支撑了阿里云几乎所有产品,包括 ECS、RDS、OSS 等等。此外,随着阿里集团核心系统 100% 商业,“洛神”也是整个阿里云集团的基础设施,历经多年双十一的严峻考验,可以称得上是云网络技术的最佳实践。

2018 年,洛神云网络架构全面升级,从 1.0 升级到 2.0。为用户提供了超大规模、超高性能、超强弹性的云网络平台。

云网络十年:探路者阿里云的理想和坚持

超大规模:随着越来越多的大型企业和大规模业务迁移上云,以及云原生的广泛应用,洛神 2.0 支持每地域百万 VPC,每 VPC 30 万实例等超大规模能力。

超高性能:为了提升云网络的性能,洛神 2.0 采用自研神龙 MOC 卡,并针对 VPC 的基础组件做了全链路的软硬一体化设计,通过硬件化让 vSwitch 的性能对比软转发提升了 10 倍以上,大幅降低延迟。Gateway 单机 bps 性能提升 20 倍以上,单机 pps 性能提升近百倍,延时降低数十倍,整体 Capex 和 Opex 大幅降低。

超强弹性:洛神 2.0 的另外一个跨越式升级是 NFV 平台,平台的定位是构建通用、灵活的平台能力,降低业务网元 NFV 化的门槛和成本,实现了复杂业务网元超高的灵活性和弹性。NFV 平台当前已经支持负载均衡、NAT 网关、v*n 网关等产品。

智能化演进:今年 5 月,阿里云网络的“VTrace: Automatic Diagnostic System for Persistent Packet Loss in Cloud-Scale Overlay Network”论文入选 SIGCOMM2020 国际通信网络领域的顶尖会议。这是洛神 2.0 在智能化网络的阶段性技术研究成果。当用户业务部署在阿里云,如何通过数据分析和机器学习的能力,实现智能化的网络问题监测、预测分析和资源规划,将是洛神未来的演进方向。

企业上云,网络先行

云网络十年:探路者阿里云的理想和坚持

如今,企业上云已经成为大势所趋,而企业上云,往往首先需要使用云网络,云网络作为云计算 IaaS 层的核心产品线,一方面可以为企业上云提供丰富的云网络产品和服务,另一方面也作为基础设施承载所有的 IaaS、PaaS 和 SaaS 云产品。云网络是新兴网络技术的最大实践者,同时也承载了最多的用户和业务场景。

作为聚焦云网络长达 10 年的阿里云网络团队,其精心打造的云网络,在数字化转型蓬勃兴起的今天,将会为企业上云提供一条捷径,帮助企业迅速获得云网络的红利。

祝顺民表示,实际上,“网络先行”也是阿里巴巴“让天下没有难做的生意”使命的具体体现,今天阿里云要引领企业用户变革,帮助企业达成商业目标,必须先为企业搭建一条可靠的上云之路,所以必须“网络先行”。“网络先行”包含了很多先行的理念,包括数据中心一定是性能先行、技术先行,如果没有更高性能,就没有办法进行业务的变革。如果没有创新的技术,就无法应对 2G、3G、4G、5G 每代网络性能的提升带来的上层应用丰富的变化,所以阿里云为了“网络先行”研发了很多的创新技术,也在很多地区部署了丰富的资源,为的就是让企业用户上云更简单,让天下没有难做的生意。

实际上,阿里云网络不仅仅是改变了企业上云的方式,为企业提供了具备超高弹性、灵活性和超大规模租户的网络,同时,它也赋予了企业通达全球,连接万物的能力。这主要源于云网络覆盖全球的基础设施,连接万物的连接能力,云网一体的产品体系。

云网络十年:探路者阿里云的理想和坚持

首先,阿里云拥有遍布全球的网络基础设施。据悉,目前阿里云在全球有 21 个 Region、61 个可用区,120 多个 POP 节点。在这样的情况下,国内外用户在上云时,就可以基于阿里云的云网络产品在几分钟内快速构建出全球化的网络基础设施,而不再需要购买物理设备和寻找多家供应商。

其次,经过多年的自主研发,阿里云已经构建了云上网络、跨地域网络、混合云网络三大场景的产品体系。云上网络实现企业数据中心虚拟化,构建云上安全隔离的专有网络架构,并将应用连接到 Internet,同时可以方便连接到阿里巴巴经济体。跨地域网络提供全球跨地域专有网络间互联,帮助客户快速构建分布式业务系统网络。而混合云网络帮助企业打通云上、云下系统和数据,构建云上云下一体的网络。

最后,云网络支持万物连接上云,包括数据中心/企业总部/分支/门店/各类移动终端,以及面向万物互联的 IoT 终端与云端互联。

如此众多的优势,能够帮助用户通达全球、连接万物也就不足为奇了。

云网络:数字经济的基础设施

云网络十年:探路者阿里云的理想和坚持

随着云计算进入 3.0 时代,从技术层面上,企业希望通过虚拟化和软件化的技术手段,达到降低成本和灵活部署的目的,云计算的加持极大的增强了网络的弹性、易管理和开放性,加速了网络行业的变革。未来网络将不仅仅是连接,它将成为计算机 I/O 的延伸,向超高带宽、超低时延、超高性能的方向演进。从业务层面,越来越多的企业选择迁移上云,也将会有更多更复杂的业务应用通过云网络开展,例如 IoT、5G、边缘的应用。云网络可以更好地帮助应用简化对底层网络复杂度依赖,让应用更简单。未来网络也将会加速以云服务为中心的架构转型,未来的网络也必定会是以云为中心的智能网络,必定是能够为人工智能与大数据应用以及云原生服务提供高性能、高弹性的网络。

同时,吴天议表示,移动化,全球化、智能化是大势所趋,降低成本、提升效率是企业永恒的话题。而使用云网络技术,将会帮助企业大幅度降低运营成本,提升运营网络的效率、最终给企业带来巨大的成本节省,这是传统网络无法做到的。更重要的是,云网络为企业提供了自建无法达到的连接全球,云—管—边—端一体的能力。

实际上,阿里云网络也得到了业界的认可,据 Gartner 发布的最新全球企业级网络市场份额报告显示,阿里云的负载均衡 SLB 增速最高达 89.7%,远超亚马逊、Citrix 等,位居全球第一。作为亚太唯一入围厂商,阿里云已经连续两季度增速赶超 AWS、F5 及 Radware 等国际大厂。同时,今年 Gartner 也将面向传统网络设备市场的“数据中心和网络”魔力象限更名为“数据中心和云网络”魔力象限,增加了一个“云”字。这些都说明云网络正在快速增长,正在受到越来越多的关注,网络云化是大势所趋。

因此,有理由相信,具有超高弹性、超强灵活性和超大规模租户、并能显著提升企业工作效率,降低企业运营成本的阿里云网络,将成为未来数据中心和云的基础设施,助力全社会数字化转型。

 

END

云网络十年:探路者阿里云的理想和坚持

往期精彩文章回顾

云网络十年:探路者阿里云的理想和坚持

蒋江伟:代码是我们最重要的资产!

云原生:重新定义信息产业生态体系

KK集团完成门店系统一期上云

是时候考虑怎么用好云了

“真假美猴王”竟然是如来的一次运维事故

勒索病毒如何防治?

菜鸟的系统架构师如何应对交易系统激增的系统流量

云原生高可用技术体系的构建思路与难点分析

民生银行场景化数据中台是如何炼成的?

阿里云原生十年磨剑

云网络十年:探路者阿里云的理想和坚持

长按扫描二维码关注凌云时刻

每日收获前沿技术与科技洞见