英伟达在gtc上给咱们看了个新东西,就是rubin ultra 这个托盘

英伟达这次在 GTC 上给咱们看了个新东西,就是 Rubin Ultra 这个托盘。这玩意里头塞了 4 个芯片,还自带了 1TB 的 HBM4 内存,这可是目前市面上唯一的 1TB 级别的 AI GPU。把它装在 NVL144 这种机架里,能让 GPU 的总数和单模块数都翻倍,性能自然就蹭蹭往上涨。Tom's Hardware 说他们拿到了现场的图片,这玩意儿的封装技术看着很先进,散热器挡住了里面的细节,但能看出来做得很紧凑,估计是用了堆叠的设计。这个托盘基本上把那些乱七八糟的线缆都省掉了,装起来肯定省事多了。以后英伟达可能会直接卖整套托盘,不给那些合作伙伴留活干了,他们就只要负责把机架装好就行。 为了配合这玩意儿的算力,英伟达还整了个叫 Kyber 的机架设计。这种新的布局不像传统的那样摆得很平,而是改成了垂直堆叠的。默认就配液冷系统,一个机架里头能塞下 144 个 Rubin Ultra。相比以前那个只有 72 个 Rubin GPU 的 Oberon NVL72 系统,这次 NVL144 的性能少说也翻了四倍。 这是 Nvidia 第一次给数据中心用的产品升级 NVLink 交换机到第七代了。新版本的带宽还是有 3600 GB/s 那么高,不过能支持的 GPU 数量更多了。为了让数据中心横向扩展得更快点,他们还搞了个 CX9-1600G 以太网处理器出来。 总之这次展示的 Rubin Ultra 绝对是个大家伙,无论是硬件规格还是设计思路都很激进。它把 1TB 的 HBM4 内存给用上了,解决了很多大型 AI 模型的瓶颈问题。给这么多 GPU 做这么多互联工作也很费功夫,但显然英伟达想通过这种方式彻底改变数据中心的面貌。这个新托盘和新机架组合起来的效果肯定很强劲,加上 NVLink 交换机的升级和 CX9 的加入,整个系统的效率肯定会大幅提升。