混合存储架构掀起算力新赛道：SK海力士披露H³方案瞄准推理能效瓶颈

在全球人工智能算力需求持续增长的背景下，存储技术面临新的压力。传统高带宽内存（HBM）性能突出，但在大规模AI任务中仍存在能耗偏高、效率受限等问题。为缓解此痛点，SK海力士研发团队历时三年推出H³混合存储架构。该技术的关键在于将两类存储单元进行协同组合：HBM3E负责即时计算数据，带宽可达768GB/s；基于堆叠NAND芯片的HBF承担大容量数据缓存，存储密度较传统方案提升8至16倍。两者通过专门设计的中介层进行调度与数据交互，形成类似“混合动力”的分工协作机制。据实验数据，在处理大型语言模型等复杂任务时，新架构表现出明显优势。在进行长达1000万个令牌的对话推理时，传统方案需要GPU与内存进行数十万次数据交换；而混合架构将约90%的数据缓存任务交由HBF完成，使GPU负载降至原来的1/16。由此带来的提升不仅体现在效率上——并发查询能力提高18.8倍，同时系统整体能效比也稳定达到传统方案的2.69倍。业内专家指出，这一进展的价值不止于单项指标提升，更反映了存储设计思路的变化：以往“金字塔”式存储层级正在被更灵活的垂直组合模式替代。SK海力士的路线表明——在AI场景下——单纯依靠硬件堆叠未必是最佳路径；通过不同存储介质的优势互补与智能调度，同样可能带来显著跃升。不过，要实现大规模商用仍需解决若干关键问题。目前团队正重点优化中介层的时序协调能力，以缩小不同存储介质之间的速度差异带来的影响；同时，生产成本控制也将直接关系到该技术的推广速度与普及程度。

存储技术的演进往往会影响计算系统的上限。SK海力士H³混合架构显示，在摩尔定律放缓的背景下，依靠架构优化与系统层创新仍能获得可观的性能提升。这个方案为AI推理提供了更具成本效益的选择，也为未来芯片与系统设计提供了新的思路。随着技术深入完善并推进商用，H³有望在数据中心与AI基础设施中获得应用，推动人工智能产业走向更高效率与更可持续的发展路径。