大算力芯片战略前瞻会：未来三年要干啥都亮出来了

云天励飞刚公布了一个大计划，他们想把做AI推理的成本给降低个100倍以上。这个大动作是在2月3日搞出来的，地点选在了深圳，云天励飞办了一场“大算力芯片战略前瞻会”，把他们未来三年要干啥全都亮出来了。你看现在AI都开始落地应用了，这可是个大转折，云天励飞决定把所有的核心资源都投到这里头，非要把这个成本壁垒给攻破不可。他们是怎么搞的？靠的就是底层架构的创新。过去一年大家也能看出来，全球的算力风向变了，重心全都往推理这边转了。谷歌2025年4月发布第七代TPU的时候，直接把它叫做“Ironwood”，意思就是给推理时代打下的基石。谷歌还特意强调了一下大规模推理和能效方面的优化。英伟达那边动作也挺快的，2025年12月的时候跟Groq搞了个非独占许可协议，还把Groq的工程人才团队招进了自己家。这可不是小事儿啊，摆明了就是要增强推理和实时工作的能力。这些信号加起来就是一个趋势：以前是比谁模型参数多，现在是比谁的应用跑得久、跑得稳、跑得便宜。单位推理成本和交付效率现在成了大难题。这时候光靠一个指标肯定不行了，得靠系统级的协同才行。云天励飞选了GPNPU这条路子来走，提出了一个公式：“GPNPU等于GPGPU加上NPU再加上3D堆叠存储”。这个公式是为了兼顾通用性和高效性的。云天励飞董事长兼CEO陈宁说过支撑他们的是长期积累的护城河。他把五大关键要素总结出来了：技术、产能、生态、市场、资本。这五个方面配合好了，不仅是底气也是保障。至于供应链安全这块儿？高级副总裁兼CFO邓浩然说了一句很实在的话：他们是国内为数不多有充足国产产能保障的企业之一。这让以后大规模量产和交付都有了很高的确定性。至于未来的规划？CTO李爱军表示会一直盯着DeepVerse这个芯片不放。他说会针对推理成本、时延和吞吐这几个矛盾使劲儿迭代产品。路线图会跟着国际主流平台走一代一代进化的路子，专门盯着长上下文预填充和低时延解码这两个关键阶段的系统优化做文章。最后云天励飞还说了一句挺实在的话：推理时代的竞争本质上是单位推理成本的竞争。只有把它做得足够便宜、足够稳定、足够好用了，AI才能从“看得见的能力”变成“用得起的生产力”。他们打算以后就拿GPNPU架构当核心武器了，全力推进云端大算力的软硬协同和存储体系攻坚目标就是把百万Tokens的推理成本降低100倍以上。这也是为了推动大模型真正走向规模化的交付。