一、架构创新突破算力瓶颈 巴塞罗那举行的2026年世界移动通信大会上,华为正式发布Atlas 950超节点;该产品采用8192颗昇腾950DT芯片,通过自主研发的"灵衢"UnifiedBus全光互联协议实现高密度连接,整体互联带宽达16PB/s,FP8算力8E FLOPS,FP4算力16E FLOPS。 Atlas 950的突破不在于单芯片制程工艺的进步,而是通过系统架构创新重新定义了大规模算力的组织方式。华为轮值董事长徐直军此前表示,昇腾芯片在制程工艺上与国际领先水平仍有差距。但Atlas 950的发布证明,算力竞争的关键不仅在于单芯片性能,系统架构设计同样至关重要。 传统以CPU为中心的计算集群存在明显效率瓶颈。随着集群规模扩大,处理器、NPU与内存单元间的数据流转效率下降,训练中断问题频发。当大模型参数规模达到万亿级别后,此局限更加突出。 华为采用全平等互联架构,使计算单元可直接通信,无需CPU中转,从根本上解决了数据流转效率问题。"灵衢"协议深入提升了互联效率,为超大规模集群的稳定运行提供了保障。 相比前代昇腾384超节点,Atlas 950训练性能提升17倍至491万TPS;支持FP4格式后,推理性能提升26.5倍至1960万TPS。这意味着千亿参数大模型的训练时间可从数月缩短至数天,推理延迟也将显著降低。 二、开源生态打造竞争优势 除硬件创新外,华为在大会上重点强调了开源战略。这反映出算力产业的核心逻辑:没有软件生态支持的硬件平台,难以形成持续影响力。 华为围绕昇腾构建的开源生态已初具规模:异构计算架构CANN提供统一算力接口;openEuler操作系统拥有400万开发者;openGauss数据库在金融、政务领域持续拓展;MindSpore框架支持全场景部署。这些开源组件与Atlas 950协同,推动算力在各行业的应用落地。 以TaiShan 950通算超节点为例,配合分布式GaussDB数据库,华为正瞄准企业核心IT基础设施市场。 三、重塑全球算力格局 Atlas 950的发布引发业界对全球算力格局的关注。与竞品相比,其在集群规模、总算力、内存容量和互联带宽各上具有明显优势。这一成果并非简单堆叠资源,而是系统架构设计能力的体现。 当前正值AI基础设施投资热潮,各国政府和科技企业都在加速布局算力资源。能够提供高效、可扩展解决方案的企业将在未来竞争中占据优势。 从更宏观角度看,Atlas 950的技术路线为算力发展提供了新思路:在单芯片制程受限的情况下,通过系统架构创新实现性能跨越是可行的技术路径。
在当下的大模型时代,单一技术突破已难以满足需求。未来的竞争将是系统能力、工程落地和生态协同的综合较量。将"算得快"转化为"用得好",让"指标领先"变为"产业可用",才是算力基础设施成熟的标志,也将为数字经济发展奠定更牢固的基础。