来源:编译自nextplatform
这里20亿美元,那里20亿美元,到处都是20亿美元,很快这些钱就累积起来了。但是,考虑到目前Grace-Blackwell计算机架的成本,以及未来Vera-Rubin计算机架预计更高的成本,这些资金的流入实际上相当于人工智能行业巨头英伟达对芯片生态系统的投资。
我们估计,英伟达在截至明年1月的2027财年将实现1500亿美元至1600亿美元的净利润。这家绿色巨头可以进行大量20亿美元的投资,以帮助其希望市场大规模生产的芯片类型落地,同时确保结盟——有时甚至是与竞争对手结盟——这将有助于其自身平台在可能更加多元化的GenAI未来中得到推广。
芯片制造商 Marvell 与英伟达一样,已基本转型为一家人工智能数据中心公司。该公司是最新一家获得英伟达 20 亿美元投资的企业。这笔投资旨在帮助 Marvell 将多项技术投入量产,同时(但显然并非依赖于)双方的战略合作,该合作允许客户将两家公司的多种技术进行组合搭配,以构建其人工智能系统。
英伟达对Marvell的20亿美元投资,与3月初英伟达对Lumentum和Coherent的两笔20亿美元投资遥相呼应。在这两笔交易中,英伟达确保Lumentum和Coherent能够提高共封装光学(CPO)组件所用激光器的产量,因为英伟达正在将这项技术添加到其Quantum-X InfiniBand和Spectrum-X以太网横向扩展交换机中,这些交换机用于将GPU加速系统连接成超级计算集群。 (这与横向扩展网络形成对比,横向扩展网络使用低延迟、高带宽的交换机和端口,在服务器节点或机架级系统中为 CPU、GPU 和 XPU 提供一致的内存。)我们认为 Lumentum 和 Coherent 对英伟达的未来发展都很有意义,因为它们都开发出了类似于谷歌十多年来一直用作其网络骨干,以及最近用作其 TPU 集群一致内存网络骨干的光路交换机。
Marvell之所以引人注目,还有其他原因,而不仅仅是两家公司在公告中提到的那些显而易见的原因。
该协议明确要求 Marvell 支持 Nvidia 的授权 NVLink Fusion 端口,更确切地说,Marvell 表示“将提供定制的 XPU 和与 NVLink Fusion 兼容的纵向扩展网络”。但这并不一定意味着 Marvell 将支持 Nvidia 的 NVSwitch 交换机,而且措辞听起来更像是 Marvell 将能够在 UALink 和/或 PCI-Express 6.0 交换机上支持 NVLink 协议;该公司刚刚发布了 Structera S 60260,该产品支持 260 条 PCI-Express 通道,总带宽可能约为 2.1 TB/秒。这看起来像是对 XConn 现有 PCI-Express 5.0 产品的升级,Marvell 于今年 1 月以 5.4 亿美元收购了 XConn。Nvidia目前的 NVSwitch 4 和 5 ASIC 单端口带宽为 1.8 TB/秒,总带宽为 7.2 TB/秒。所以,Marvell 或许也在获取 NVSwitch 芯片的访问权限,以便接入它正在帮助构建的 AI 系统。
考虑到亚马逊网络服务 (AWS) 是 Marvell 最大的定制 AI 芯片客户,而且 AWS 已经与英伟达 (Nvidia) 建立了 NVLink Fusion 合作伙伴关系,并且AWS 还表示未来的 Trainium 4 XPU 将同时支持 UALink 和 NVLink 协议,那么 AWS 在 Trainium 芯片从设计到封装方面的主要合作伙伴——也就是 Marvell——也需要获得英伟达的技术,这是合情合理的。
我们面临的问题是,NVLink协议的授权方是谁?客户在何种条件下才能在可能使用自研CPU和XPU的定制AI集群中使用该协议?在我们看到的交易中,似乎没有人真正提及这一点,但显然,如果您购买了NVLink硬件,您可能也希望获得NVLink软件的使用权。不过,也许这些公司只是想要高速的带宽,并打算自行研究协议。也可能两者兼而有之。超大规模数据中心和云平台建设者就是这种情况。尤其是云平台,它们需要Nvidia和AMD的系统来销售云容量,因为大多数客户都希望使用这些系统,但它们也希望创建自己的计算引擎(以及即将推出的互连架构),以便降低内部应用或以服务形式提供的应用的成本。
根据合作协议,英伟达表示将为带有 NVLink Fusion 端口的定制 XPU 提供支持技术,包括 Vera CPU、Groq LPU、ConnectX 网卡、Bluefield DPU、NVLink 互连和 Spectrum-X 交换机。
我们不禁好奇,英伟达收购Celestial AI后,是否会考虑采用后者开发的光子结构。Marvell于2025年12月以32.5亿美元收购了Celestial AI 。这种光子结构能够实现行级相干存储,并具备网络内集体处理能力,这与英伟达过去几代NVSwitch芯片的功能类似。而这些功能都得益于英伟达在2020年4月以69亿美元收购Mellanox Technologies时获得的InfiniBand技术。
正如我们所说,根据战略合作伙伴关系,Marvell(以及因此而来的 AWS 和任何未来的其他 XPU 或 CPU 客户)可能会获得在 Marvell 拥有的光子结构(这是 Celestial 产品的技术名称和商标名称)上运行 NVLink 协议的权利。
我们也想知道英伟达和博通何时会建立合作关系。博通是英伟达在横向扩展网络领域的竞争对手,但它也供应各种各样的产品,包括VMware ESX Server虚拟机管理程序。本月初,我曾思考过,考虑到博通在以太网交换机ASIC领域的统治地位以及其快速增长的定制XPU业务,它或许是目前唯一能够有效制衡英伟达霸权的强大力量。
博通为谷歌生产TPU,现在也为Anthropic公司生产TPU机架,同时也是Meta Platforms公司MTIA XPU的制造商。有传言称,字节跳动和苹果是另外两大XPU客户,而现在又多了一家,OpenAI公司正委托博通将其“Titan”XPU推向市场。
目前尚不清楚这些公司是否希望在其设备上使用 NVLink Fusion 接口。但如果他们希望如此,英伟达和博通将会冰释前嫌,达成协议。毫无疑问,这项协议将包含技术交叉融合,就像我们认为 Marvell 的交易中正在发生的那样。