咱们先聊个大事,英伟达就在CES上,正式给大伙揭开了它家新一代人工智能计算平台的面纱。这代号叫“Vera Rubin”的大家伙,不光是个平台,它的核心那块Rubin GPU也全都给投产后了,这就意味着高性能计算这一行,又迎来了一次质的飞跃。 黄仁勋这位创始人兼CEO,当场把这个里程碑给指出来了。咱来看看数据多牛,这新GPU的推理能力,可是老一代Blackwell平台的5倍呢,训练性能也跟着翻到了3.5倍。说句实在的,第三代Transformer引擎配上NVFP4,浮点运算速度能飙到50 PFLOPS。内存带宽也水涨船高,升到了22TB每秒,晶体管更是塞进去了3360亿个。这堆硬指标升起来,就是给那些更复杂、更庞大的AI模型搭好的路。 黄老板也在台上解释了为啥要这么干。他说AI发展的重心变了,以前主要是搞“生成式”,现在得往“代理式”和“物理AI”上使劲,也就是让机器不光会说话,还能懂逻辑、解问题。这对算力的要求可就不一样了,不光要有峰值跑得快,还得跑久了不累,电费也得省下来。 为了应对这事儿,“Vera Rubin”平台用了六颗芯片串起来的新路子。这一堆硬件里不光有Rubin GPU和Vera CPU,还有第六代NVLink交换机、ConnectX-9 SuperNIC、BlueField-4数据处理器和Spectrum-6以太网交换机。这一套东西全是为了打通从计算到网络再到存储的“死胡同”。 它的目标就是把成本给降下来。据说是能把推理成本降到Blackwell的十分之一,训练那种混合专家模型的GPU数量也能砍掉四分之三。这就意味着以后让AI模型长时间地“思考”,大家都消费得起了。 这次不光是卖芯片这么简单,英伟达还想把整个AI的生态链给串起来。在机器人这块儿,他们弄了个高保真的模拟环境,GR00T机器人模型也升级了。自动驾驶那边更是放出了大招:全球首个开源的视觉-语言-行动推理模型“Alpamayo”。这玩意儿能理解复杂的交通因果关系,解释自己咋做的决定。 更实际的是,梅赛德斯-奔驰的CLA车型马上就要上路了。2026年第一季度就在美国卖车了,这可是技术走向大规模商用的一大步。为了应付AI智能体跑起来产生的海量数据,英伟达还专门拿出了BlueField-4 DPU来驱动的存储平台。它在GPU内存和传统硬盘之间搭了个新的“记忆层”,能让处理速度快最多5倍。 最后说个规模的事,新一代DGX SuperPOD系统能把576个Rubin GPU连起来用,这就是超大规模任务的集群方案。 英伟达也没忘了开源这事。它那个“Open Model Universe”模型库越铺越大,涵盖了机器人、生物医学这些领域。黄老板觉得开源模型虽然落后半年左右,但这差距越来越小了。 市场反应那是相当热烈。发布会那天算起,Rubin平台的订单已经有3000亿美元了。看来大家对这块顶级算力的需求是真的迫切。 这次推出的“Vera Rubin”平台不只是芯片升级,更是对AI计算方式的一次全面回应。它把核心算力提上去了,全栈架构也优化了。从机器人到自动驾驶的垂直应用再到开源生态建设,英伟达其实是想重新定义下一代AI的基础设施标准。 随着这个“算力巨兽”量产落地,全球AI研发的门槛估计要重新划分了。这场由底层算力驱动的智能化浪潮已经加速冲过来了,不管是半导体竞争还是生产效率提升,影响都特别深远。