去gpu化的浪潮还在继续席卷着整个行业

最近,AI算力的变化真让人觉得像看一场激烈的竞赛。想想2024年、2025年、2026年、2027年还有2028年,这几年中,各种动向真是让人大开眼界。先说说2月13日那天,OpenAI推出了GPT-5.3-Codex-Spark。这次他们选择了一个不太常见的招数:把主力模型在推理环节的芯片换成了Cerebras。原因很简单:Cerebras这种芯片延迟更低,能耗也更低,用起来感觉像是“所见即所得”,真的很赞。OpenAI这么一改,就等于公开告诉大家,英伟达的GPU可不是唯一的选择了。 还有摩根大通那边,2026年初泄露了一份谷歌的内部报告。报告里说,谷歌打算在2027年部署600到700万颗TPU,其中大部分要卖给Anthropic、OpenAI、Meta还有苹果这些大公司。这数字背后,其实是谷歌想把TPU变成一种公共基础设施的野心。还有Meta也加入进来,跟谷歌达成了合作,要一次性租几百万颗TPU集群来训练大模型。另一边,OpenAI又在导入英伟达最新的基于Groq技术的推理芯片。这两条消息一出来,就像两面旗帜一样宣告全球AI算力格局正在发生重大改变。 那时候还在半年前呢,整个行业都在拼命争抢英伟达的GPU。可是现在看看半年后吧,全球那些头号玩家都纷纷重新规划芯片订单了。这说明什么?说明大家都意识到了新的方向:谁拥有最低延迟和最高能效比的芯片,谁就更有竞争力。数据也能证明这一点:IDC预测到2028年中国非GPU服务器市场规模能占到整体的近50%;高盛模型显示全球非GPU芯片出货占比会从2024年的36%一路涨到2027年的45%。这些跳动的数字啊,就是资本对“去GPU化”最真实的投票。 现在的问题是:英伟达怎么破局?因为GPU确实有点尴尬了——高能耗加上高延迟成了它们的原罪。因为GPU计算单元跟显存分离嘛,每做一次运算都得走“搬数据—算结果—搬数据”的路数,这就导致能耗降不下来、延迟也很难压缩。路透社爆料说OpenAI内部多次吐槽英伟达芯片响应慢呢。 好在压力之下“NVIDIA巨龙”还是想办法自救的。在2025年底的时候他们花了近三倍的溢价买下了Groq核心技术和团队——Groq创始人Jonathan Ross可是谷歌TPU核心设计者哦!Groq的目标就是要打造一款超越谷歌TPU的芯片。所以说英伟达豪掷200亿美元其实就是把“高阶TPU”这把利刃直接插进自家阵营。 不过故事还没结束呢:去GPU化的浪潮还在继续席卷着整个行业。没几个人愿意把未来十年基础设施押注在能耗高、延迟高又封闭的技术上。但是到底谁能扛得起大旗呢?TPU能不能真正对抗GPU?英伟达重金买下的Groq又能带来什么变化?这些悬念或许就藏在下一场发布会、下一组跑分或者下一行代码里呢。