问题——AI算力跃升,存储“跟不上”成为新瓶颈; 随着大模型训练、实时推理和多模态应用快速扩张,数据中心的压力已不只来自计算芯片。数据读写并发、持续吞吐、延迟表现和稳定性,正成为影响算力发挥的关键因素。业内普遍认为,在高密度部署、长期满负载运行的场景下,存储设备发热引发的降频、性能波动和可靠性风险,正从“配套问题”升级为影响系统效率与运维成本的重要变量。 原因——高功耗与高密度叠加,传统风冷边际效应下降。 一上,AI集群追求更高机柜功率密度和更紧凑的系统集成,设备间热量耦合更明显;另一方面,企业级固态硬盘高强度读写下持续发热,对散热系统的响应速度与散热均匀性提出更高要求。相比风冷,液冷在传热效率、局部热点控制以及噪声与空间限制上更具优势,使其从服务器与加速器散热逐步扩展到更多部件,形成“全栈散热”的升级趋势。鉴于此,SK海力士选择在GTC大会展示液冷式eSSD,指向的是AI数据中心对“持续稳定输出”的现实需求。 影响——液冷eSSD直指稳定性与效率,或重塑数据中心存储形态。 据介绍,SK海力士将在大会上展示与英伟达联合开发的液冷式企业级固态硬盘(eSSD)。从行业角度看,液冷对存储的价值不止是降温,更在于让设备在高负载、长周期运行中保持更稳定的性能曲线,减少与热涉及的的故障和维护介入,从而提升集群可用性与整体能效。同时,更好的温控也可能为更高带宽、更高密度的存储形态提供设计空间,为AI训练的数据通道提供更可靠的底层支撑。 除eSSD外,SK海力士还将展示LPDDR5X内存产品,并强调其已用于英伟达相关AI超级计算平台。内存作为连接计算与数据的关键环节,直接影响训练过程中的数据供给效率。高带宽、低功耗的内存配置有助于缓解数据搬运压力,在能耗与性能之间取得更好的平衡。存储与内存的同步升级,也反映出AI基础设施竞争正从单一器件延伸到系统协同与生态适配。 对策——以联合研发与平台适配打通“从器件到系统”的落地路径。 在AI基础设施加速迭代的周期里,单点技术突破往往难以快速规模化落地,需要与平台设计、散热体系、机柜部署和运维标准同步推进。SK海力士与英伟达采取联合开发模式,工程导向明确:一是围绕特定AI系统的功耗与热设计进行定制优化,降低“能用但不稳”的风险;二是借助生态伙伴平台完成验证,加速在数据中心场景的适配与推广;三是为更高密度集群提供可复制的参考方案,减少行业试错成本。 对数据中心运营方来说,下一步更需要把存储、计算与散热纳入一体化规划:在采购层面关注全生命周期成本,而非仅看单机性能;在部署层面推动液冷兼容的机柜与管路标准化;在运维层面完善热监测与故障预测机制,提升高负载场景下的连续服务能力。 前景——AI存储或走向“液冷化、集成化、平台化”,竞争焦点转向系统效率。 从趋势看,AI应用持续扩张将推动存储需求从单纯容量导向,转向吞吐、延迟、稳定性与能效并重。液冷式存储的出现,可能成为下一阶段高密度数据中心的重要选项之一。同时,存储产品形态或将更强调与服务器、网络和加速器的协同设计,竞争重点也将从器件指标转向系统级效率。业内预计,随着标准、供应链与工程经验逐步完善,液冷方案的应用范围将继续扩大,并带动数据中心基础设施进入新的升级阶段。
在人工智能持续推进的背景下,存储技术的演进正在成为支撑算力落地的重要一环;此次头部厂商的联合研发,为缓解存储热管理与性能稳定性等痛点提供了更直接的路径,也为未来AI数据中心的存储架构升级提供了参考。随着涉及的技术与工程化能力深入成熟,计算与存储的协同优化有望持续提升数据中心效率,并推动更多行业的数字化进程。