GTC2026临近:英伟达押注推理芯片与新架构,代工版图或现三星“分流”

当前,人工智能正从“训练为主”转向“大规模推理部署”,对芯片的效率与成本提出了更高要求。作为全球GPU市场的核心玩家,英伟达正处在业务转向的关键节点。外界预计——在即将举行的GTC大会上——英伟达将公布一套整合Groq LPU技术的推理芯片方案。该技术采用SRAM存储架构,据称在大语言模型推理上的效率可达传统GPU的10倍,有望满足OpenAI等头部企业的需求。

英伟达的这多项调整,折射出AI芯片行业正在加速重塑:算力重心从训练转向推理,采购从单一走向多元,架构从传统演进到更激进的系统级创新;面对ASIC与自研芯片的持续推进,英伟达能否通过推理芯片创新与供应链优化继续稳住领先地位,将成为观察AI产业下一阶段发展的重要窗口。