去gpu化的浪潮还在继续席卷着整个行业

最近，AI算力的变化真让人觉得像看一场激烈的竞赛。想想2024年、2025年、2026年、2027年还有2028年，这几年中，各种动向真是让人大开眼界。先说说2月13日那天，OpenAI推出了GPT-5.3-Codex-Spark。这次他们选择了一个不太常见的招数：把主力模型在推理环节的芯片换成了Cerebras。原因很简单：Cerebras这种芯片延迟更低，能耗也更低，用起来感觉像是“所见即所得”，真的很赞。OpenAI这么一改，就等于公开告诉大家，英伟达的GPU可不是唯一的选择了。还有摩根大通那边，2026年初泄露了一份谷歌的内部报告。报告里说，谷歌打算在2027年部署600到700万颗TPU，其中大部分要卖给Anthropic、OpenAI、Meta还有苹果这些大公司。这数字背后，其实是谷歌想把TPU变成一种公共基础设施的野心。还有Meta也加入进来，跟谷歌达成了合作，要一次性租几百万颗TPU集群来训练大模型。另一边，OpenAI又在导入英伟达最新的基于Groq技术的推理芯片。这两条消息一出来，就像两面旗帜一样宣告全球AI算力格局正在发生重大改变。那时候还在半年前呢，整个行业都在拼命争抢英伟达的GPU。可是现在看看半年后吧，全球那些头号玩家都纷纷重新规划芯片订单了。这说明什么？说明大家都意识到了新的方向：谁拥有最低延迟和最高能效比的芯片，谁就更有竞争力。数据也能证明这一点：IDC预测到2028年中国非GPU服务器市场规模能占到整体的近50%；高盛模型显示全球非GPU芯片出货占比会从2024年的36%一路涨到2027年的45%。这些跳动的数字啊，就是资本对“去GPU化”最真实的投票。现在的问题是：英伟达怎么破局？因为GPU确实有点尴尬了——高能耗加上高延迟成了它们的原罪。因为GPU计算单元跟显存分离嘛，每做一次运算都得走“搬数据—算结果—搬数据”的路数，这就导致能耗降不下来、延迟也很难压缩。路透社爆料说OpenAI内部多次吐槽英伟达芯片响应慢呢。好在压力之下“NVIDIA巨龙”还是想办法自救的。在2025年底的时候他们花了近三倍的溢价买下了Groq核心技术和团队——Groq创始人Jonathan Ross可是谷歌TPU核心设计者哦！Groq的目标就是要打造一款超越谷歌TPU的芯片。所以说英伟达豪掷200亿美元其实就是把“高阶TPU”这把利刃直接插进自家阵营。不过故事还没结束呢：去GPU化的浪潮还在继续席卷着整个行业。没几个人愿意把未来十年基础设施押注在能耗高、延迟高又封闭的技术上。但是到底谁能扛得起大旗呢？TPU能不能真正对抗GPU？英伟达重金买下的Groq又能带来什么变化？这些悬念或许就藏在下一场发布会、下一组跑分或者下一行代码里呢。