英伟达加码推理芯片版图:发布LPU并整合Rubin平台,押注多智能体算力新赛道

人工智能产业的竞争格局正在发生深刻变化。

过去数年,生成式AI的爆发使得大模型训练成为算力需求的绝对中心,英伟达凭借GPU的绝对主导地位,在这一轮技术浪潮中获得了巨大收益。

然而,随着模型参数优化进入边际效应递减阶段,产业竞争的焦点正在从模型训练向推理应用转移。

智能体技术的涌现和大规模部署,使得推理成为新的算力消耗主体,这一转变对英伟达的市场地位提出了新的挑战。

英伟达对这一市场变化的反应迅速而坚决。

在3月17日举行的GTC 2026大会上,英伟达CEO黄仁勋发布了Vera Rubin平台,其中包含Groq 3 LPU这一专用推理加速芯片。

LPU即语言处理单元,是针对AI推理场景优化设计的专用芯片。

根据英伟达的规划,Rubin GPU与Groq LPU的结合将把当前每秒100个token的吞吐量提升至1500个token甚至更高,从而为大规模智能体交互提供充分的计算支撑。

这一战略布局并非临时之举,而是英伟达的深思熟虑。

2025年12月,英伟达以约200亿美元的价格收购了Groq的核心技术资产,Groq 3 LPU正是这次收购后的首个公开成果。

通过这次收购,英伟达不仅获得了推理芯片的先进技术,还将Groq的创始人纳入麾下,进一步强化了其在推理领域的技术储备。

从市场数据看,英伟达的这一举措具有前瞻性。

根据高盛全球投资研究部的预测,在AI服务器的AI芯片中,非GPGPU芯片的出货占比将从2024年的36%上升至2027年的45%,而GPGPU芯片的占比将相应下降。

这意味着专用推理芯片的市场空间正在快速扩大。

业界分析人士指出,GPU在基础大模型训练和通用计算场景中仍具有竞争力,但在模型部署和推理阶段,ASIC类芯片因其更优的能效比和更低的响应延迟而更具优势。

英伟达推出LPU,正是对这一市场分化趋势的战略应对。

英伟达对推理市场的重视已经获得了市场认可。

OpenAI上月宣布与英伟达达成协议,将采购具有专用推理能力的芯片。

这一合作不仅验证了英伟达推理芯片的市场价值,也为其他云服务商和模型厂商树立了示范效应。

英伟达的野心不止于芯片本身。

在发布Groq 3 LPU的同时,英伟达还推出了Groq LPX机架系统,这是一个专门为新型Groq加速器设计的完整解决方案。

这一举措表明英伟达正在从单纯的芯片供应商向完整生态提供商转变,试图通过从芯片到系统、从硬件到软件的全栈布局,进一步巩固其市场地位。

黄仁勋在大会上还透露,到2027年底,Blackwell和Rubin两条产品线的年收入将达到1万亿美元,这比半年前的预测翻了一倍。

这一大胆的预测反映了英伟达对推理市场增长潜力的高度看好,也表明推理芯片已成为英伟达未来增长的重要驱动力。

人工智能产业正从技术研发迈向规模应用的关键阶段,算力需求的结构性变化预示着新一轮产业变革的到来。

英伟达的战略转型不仅反映了企业对市场趋势的前瞻把握,更折射出全球AI产业发展的新方向。

在技术创新与商业落地的双轮驱动下,AI芯片市场的竞争格局或将迎来深刻重塑,这既带来新的发展机遇,也对企业的技术储备和战略定力提出更高要求。