Nvidia 收购 Mellanox 背后的野心和启示
Nvidia 是全球公认的 GPU 技术和市场双冠王。但黄老板的野心远不止于此,Nvidia 也在积极布局云端服务器市场,其中的一项重要举措就是收购 Mellanox。
今年 3 月 11 日,Nvidia 宣布将以 69 亿美元(约合人民币 488 亿元)的价格,收购网络芯片厂商 Mellanox Technologies,相当于每股 125 美元,相较后者当时的收盘价溢价 14%,而且全部以现金支付。
这也是 Nvidia 历史上最大规模的一笔收购,击败了同样想拿下 Mellanox 的Intel。
经历一年审批,收购终达成
Mellanox 是以色列一家高性能网络芯片和解决方案提供商,其产品包括 Smart NIC,网络交换机芯片和高速数据互联等。
它在人工智能兴起的时期,推出了独特的超高性能 InfiniBand 数据互联产品,大大提升了数据中心人工智能训练的速度和效率,此后就牢牢占据了 AI 云端服务器数据互联产品的高地。
其实在 Nvidia 收购 Mellanox 之前,Mellanox 的 RDMA 等重要技术已经和 Nvidia GPU 一起出现在了许多云端高性能服务器中。
Nvidia 从去年开始收购 Mellanox 的流程,各国政府审批的时间接近一年。
由于之前高通收购 NXP 的交易没有通过中国审批而最终失败,因此 Nvidia 收购 Mellanox 是否能够最终过中国审批,也成了之前各方关注的一个不确定因素。
随着上周中国的审批终于获得批准,Nvidia 收购 Mellanox 的政府审批流程全部完成,双方将于 4 月底完成交易。
另一场套娃式收购
当 Nvidia 开启 Mellanox 收购后不久,Mellanox 自身也完成了一项收购,将网络安全和智能 IP 提供商 Titan IC 收入麾下。
Titian IC 总部位于北爱尔兰贝尔法斯特,成立于 2007 年,其提供的 IP 主要针对网络安全和内容智能。
在数据中心中,恶意入侵的网络流量通常都存在一些固定的特征,而 Titan IC 提供的硬件 IP 和软件,能够在硬件加速器中检测出这些特征,从而让 CPU 专注于其他的事情。
事实上,这样的需求一直存在,只是之前用 CPU 做也能足够快。但是大数据时代到来后,一方面数据流量大大增加,另一方面在存储和网络方面使用专用的基于 X86 服务器,也难以在成本和性能上满足应用的需求。
因此把相关网络算法硬化成专用加速器的做法,在近几年里得到了重视,而 Titan IC 正是靠此起家。
据悉,在 Mellanox 要收购 Titan IC 之前,Titan IC 的 RXP 技术已经在 Mellanox 的产品中得到了应用,而随着智能网络安全专用算法加速硬件越来越重要,这项收购也是顺理成章。
收购背后,行业门槛的提高
现在看来,Nvidia、Mellanox 和 Titan IC 的套娃式收购,将大大提升云端人工智能芯片产品的门槛。该收购案完成后,将对云端 AI 芯片市场产生比较长远的影响。
生态门槛
首先可以看到,Nvidia 对 Mellanox 的收购有些类似上下游式整合——Nvidia 代表了云端人工智能的生态,而 Mellanox 则代表了云端人工智能的核心技术,收购后意味着该核心技术与 Nvidia 的生态牢牢地绑定了在一起。
众所周知,Nvidia 的 GPU 在目前是云端人工智能加速的主流解决方案。
虽然也有一些其它 AI 芯片公司提供云端人工智能训练的加速,但和 Nvidia 的相比都显得缺乏竞争力,最多只能算是 Nvidia 之外的一个候补供货方案。
为什么会这样?究其根本,并不是这些 AI 芯片公司的峰值算力不够,而是在生态上难以与 Nvidia 的 CUDA 相抗衡,在软件方案上缺乏 Nvidia CUDA 这样的完整编程和工具链,这些工具需要很长的时间积淀,也成了 Nvidia 的核心竞争力。
如果说以上只是 Nvidia 生态在单机训练上的竞争门槛的话,那么在目前广为应用的分布式训练上,Nvidia 则构筑了更高的门槛。
分布式计算门槛
分布式训练中,需要将数据分布到多台服务器上去做单步训练,同时在完成单步训练之后,需要将分布在多台服务器上的权重和梯度信息做一次同步,才能继续训练,而该同步过程对于多台服务器之间的数据交换则形成了很大的考验。
一方面,在硬件上会需要高速的数据交换互联,另一方面,在底层软件方面,也需要高效的接口,防止数据交换的软件层成为性能的瓶颈。
正因为分布式训练对于数据交互的高需求,在 2016 年之前都没有特别好的解决方案,直到 Mellanox 的 InfiniBand 出现,高性能互联解决方案才开始出现。
后来随着技术的迭代,目前以太网+RDMA 的方案(同样是 Mellanox 的强项)成为了常规的解决方案,而 Nvidia 的 NCCL 则成为了底层软件接口的标准。
换句话说,在 Nvidia 收购 Mellanox 之前,Mellanox 的数据互联方案+Nvidia 的 GPU 底层接口经过多年迭代,已经形成了一个非常完善的工程解决方案,而其它 AI 芯片公司想要复制 Nvidia GPU 的分布式训练,必须要重复一遍这样的迭代过程。
在整合完之后,Nvidia GPU 和 Mellanox 的以太网+RDMA 强强联手,相当于分布式计算方面诞生一个巨头,将彻底碾压其他的竞争对手。
例如,想要真正进入分布式训练是必选项的云端 AI 芯片市场,必须能自主掌握 RDMA 等分布式训练需要的数据交换技术,而能做到这一点的公司寥寥无几。
其中一个例子就是 Habana,它的一大亮点就是在 AI 训练芯片中包含了 RDMA,这也是 Intel 之前高价收购 Habana 的重要因素。
云端高性能计算
在 Mellanox 收购了 Titan IC 之后,三者的结合提供了包含人工智能+高速数据互联解决方案+网络安全加速的横跨多个领域的完整方案,也让其产品在数据中心竞争中占据了极为有利的位置。
更重要的是,Nvidia 的野心并不仅仅在人工智能,而是想要扩展到更广的数据中心高性能计算领域。
例如,在未来十年内,我们认为除了人工智能之外,还有许多有很大潜力的计算会需要在云端完成。
举例来说,与健康相关的基因计算就是一个重要方向,而 Nvidia 也在之前收购了从事基因计算并行化领域的初创公司 ParaBricks,显示了它在该方向的布局。
而对于云端分布式计算来说,事实上 Nvidia GPU+Mellanox RDMA+Nvidia CUDA 都将形成难以撼动的整体解决方案,这样的黄金组合或许将统治云端高性能计算加速市场很久。
中国半导体行业需考虑相关布局
Nvidia 收购 Mellanox 之后,意味着欧美半导体公司在云端计算领域正在提速,中国半导体行业和相关公司应考虑加快布局。
首先,从常规行业竞争来说,Nvidia+Mellanox 的完整方案提升了竞争壁垒,如果中国的半导体行业再不能进入该行业,那么在技术快速发展的未来几年,中国公司和 Nvidia 之间的技术差距会越拉越大。
也就是说云端 AI 这一个高技术同时也高利润率的行业我们将拱手相让,等到该领域的技术发展接近饱和时才能真正进入竞争行列。
即使中国公司在未来几年还不足以和 Nvidia 竞争,想要在数年后实现追赶,也应该在今天考虑开始布局,因为追赶也是需要时间的——正如海思的手机芯片从第一代完成设计,到真正赶上世界顶尖水平用了数年的时间。
其次,从非常规竞争的角度考虑,一旦因为政治原因中国无法再进口 Nvidia 的产品,那么在国内公司无法填补空白情况下,对于中国以人工智能为代表的新基建造成的伤害将非常大。
目前,Nvidia 的 GPU 加速方案对于人工智能(以及以基因计算为代表的新兴科学计算)来说是像 CPU 一样的核心组件,因此我们也希望能有中国半导体公司能填补这一空白。
综上,云端服务器的加速解决方案一方面是高利润率的市场,另一方面对于中国的新基建也是核心器件,因此无论是从市场角度还是从安全角度考虑,中国半导体行业都应该要积极布局这个市场。
—— 完 ——
扫描二维码,加入讨论群
获得更多优质数据集
了解人工智能落地应用
关注顶会&论文
回复「读者」了解更多
更多精彩内容(点击图片阅读)