英伟达老大黄仁勋谈人工智能大计划

英伟达老大黄仁勋最近谈了谈他们的人工智能大计划,说软硬件得两手抓,这才是行业的长久之计。 面对这几年人工智能发展太快,硬件跟不上的问题,像英伟达这种领头羊的企业,都在重新琢磨技术路怎么走、钱怎么赚。黄仁勋在公开场合把这些看法都讲透了,这让我们能从一个更深的角度看这事儿。 他说现在这行竞争的标准变了,大家现在都讲究“Token经济学”。所谓Token,就是电脑在一秒钟里能跑多少任务。衡量标准就是看每瓦电能跑多少个Token,或者是每块钱花下去能弄出多少Token。这就意味着算力不光看跑得有多快,还要看用起来费不费钱、费不费电,更得看能不能可持续地跑下去。 对于市场上那种想省钱买低端配置的声音,黄仁勋直接给了回应。他说芯片买的时候是一次性交易,但软件开发要花一辈子去维护。所以他们公司一直坚持统一的内存架构和软件系统,就是为了不让生态变得乱七八糟。虽然一开始买硬件贵点,但这样维护起来就省心多了。只要英伟达把一套软件系统优化好了,全世界用同样架构的电脑都能立马享受到好处。这种一次优化、大家都受益的模式,是在从全生命周期的角度帮企业省钱,也让自己的平台更有竞争力。 开源模型现在已经包揽了全球约四分之一的Token生成任务。这种比预期还快的增长势头,让人工智能技术不仅能在大机房里用,还能渗透到各家公司的本地部署里去。开源的火和硬件标准的统一相互促进,正好把人工智能的普及推上了一个新台阶。 在硬件这块儿,黄仁勋重点介绍了他们的新一代Vera Rubin平台。这平台用的是先进的模块化设计,彻底改变了以前修电脑的老样子。以前的Grace Blackwell系统要是一个地方坏了,整个机架都得停。现在的Rubin平台不一样了,机器还在跑的时候就能把关键的NVLink连接器换下来进行热更换。 这种设计不仅仅是让运维变简单、省钱,更是把供应链的效率也重新梳理了一遍。以前装一个节点要花两个小时,现在只用五分钟就能搞定。 他们还把电线也给减了不少,散热系统更是从局部水冷变成了百分百的全液冷方案。这么一通操作下来,硬件的稳定性和可靠性都上来了。 黄仁勋还特意提到现在最让人头疼的问题就是电不够用。现代的人工智能任务尤其是推理任务,电流波动特别厉害,一下子能跳25%。为了对付这个问题,数据中心不得不留出好多备用电力来扛峰值需求。结果就是电网利用率很低。 Rubin平台通过系统级的设计在机架内部就把这种电流波动给“抚平”了。就算单个显卡的最高功耗达到了1800瓦,整个系统对外呈现的还是一条平稳的用电曲线。 这个技术突破让数据中心不用再搞太多冗余的电力配置了,能把有限的电用到极致。这样既能提高算力密度又能环保省电。 黄仁勋这一番话意思很明确:接下来的全球人工智能大战不光比谁的芯片牛、谁的软件牛,还得看谁的系统能效好、谁的全生命周期成本控制得好。 英伟达的战略布局就是要从芯片、系统一直到软件栈都做到自己手里的垂直整合优势。这不是一家企业的事儿了。 现在整个行业都在变快变深的时候,他们的想法正好给所有参与者提了个醒:以后要怎么做投资和研发?怎么平衡短期成本和长期效能? 这就是摆在所有人面前的大课题。