GTC大会聚焦高算力散热与存储瓶颈 SK海力士携英伟达推出液冷企业级固态硬盘方案

问题——AI算力跃升，存储“跟不上”成为新瓶颈；随着大模型训练、实时推理和多模态应用快速扩张，数据中心的压力已不只来自计算芯片。数据读写并发、持续吞吐、延迟表现和稳定性，正成为影响算力发挥的关键因素。业内普遍认为，在高密度部署、长期满负载运行的场景下，存储设备发热引发的降频、性能波动和可靠性风险，正从“配套问题”升级为影响系统效率与运维成本的重要变量。原因——高功耗与高密度叠加，传统风冷边际效应下降。一上，AI集群追求更高机柜功率密度和更紧凑的系统集成，设备间热量耦合更明显；另一方面，企业级固态硬盘高强度读写下持续发热，对散热系统的响应速度与散热均匀性提出更高要求。相比风冷，液冷在传热效率、局部热点控制以及噪声与空间限制上更具优势，使其从服务器与加速器散热逐步扩展到更多部件，形成“全栈散热”的升级趋势。鉴于此，SK海力士选择在GTC大会展示液冷式eSSD，指向的是AI数据中心对“持续稳定输出”的现实需求。影响——液冷eSSD直指稳定性与效率，或重塑数据中心存储形态。据介绍，SK海力士将在大会上展示与英伟达联合开发的液冷式企业级固态硬盘（eSSD）。从行业角度看，液冷对存储的价值不止是降温，更在于让设备在高负载、长周期运行中保持更稳定的性能曲线，减少与热涉及的的故障和维护介入，从而提升集群可用性与整体能效。同时，更好的温控也可能为更高带宽、更高密度的存储形态提供设计空间，为AI训练的数据通道提供更可靠的底层支撑。除eSSD外，SK海力士还将展示LPDDR5X内存产品，并强调其已用于英伟达相关AI超级计算平台。内存作为连接计算与数据的关键环节，直接影响训练过程中的数据供给效率。高带宽、低功耗的内存配置有助于缓解数据搬运压力，在能耗与性能之间取得更好的平衡。存储与内存的同步升级，也反映出AI基础设施竞争正从单一器件延伸到系统协同与生态适配。对策——以联合研发与平台适配打通“从器件到系统”的落地路径。在AI基础设施加速迭代的周期里，单点技术突破往往难以快速规模化落地，需要与平台设计、散热体系、机柜部署和运维标准同步推进。SK海力士与英伟达采取联合开发模式，工程导向明确：一是围绕特定AI系统的功耗与热设计进行定制优化，降低“能用但不稳”的风险；二是借助生态伙伴平台完成验证，加速在数据中心场景的适配与推广；三是为更高密度集群提供可复制的参考方案，减少行业试错成本。对数据中心运营方来说，下一步更需要把存储、计算与散热纳入一体化规划：在采购层面关注全生命周期成本，而非仅看单机性能；在部署层面推动液冷兼容的机柜与管路标准化；在运维层面完善热监测与故障预测机制，提升高负载场景下的连续服务能力。前景——AI存储或走向“液冷化、集成化、平台化”，竞争焦点转向系统效率。从趋势看，AI应用持续扩张将推动存储需求从单纯容量导向，转向吞吐、延迟、稳定性与能效并重。液冷式存储的出现，可能成为下一阶段高密度数据中心的重要选项之一。同时，存储产品形态或将更强调与服务器、网络和加速器的协同设计，竞争重点也将从器件指标转向系统级效率。业内预计，随着标准、供应链与工程经验逐步完善，液冷方案的应用范围将继续扩大，并带动数据中心基础设施进入新的升级阶段。

在人工智能持续推进的背景下，存储技术的演进正在成为支撑算力落地的重要一环；此次头部厂商的联合研发，为缓解存储热管理与性能稳定性等痛点提供了更直接的路径，也为未来AI数据中心的存储架构升级提供了参考。随着涉及的技术与工程化能力深入成熟，计算与存储的协同优化有望持续提升数据中心效率，并推动更多行业的数字化进程。