混合存储架构掀起算力新赛道:SK海力士披露H³方案瞄准推理能效瓶颈

在全球人工智能算力需求持续增长的背景下,存储技术面临新的压力。传统高带宽内存(HBM)性能突出,但在大规模AI任务中仍存在能耗偏高、效率受限等问题。为缓解此痛点,SK海力士研发团队历时三年推出H³混合存储架构。该技术的关键在于将两类存储单元进行协同组合:HBM3E负责即时计算数据,带宽可达768GB/s;基于堆叠NAND芯片的HBF承担大容量数据缓存,存储密度较传统方案提升8至16倍。两者通过专门设计的中介层进行调度与数据交互,形成类似“混合动力”的分工协作机制。 据实验数据,在处理大型语言模型等复杂任务时,新架构表现出明显优势。在进行长达1000万个令牌的对话推理时,传统方案需要GPU与内存进行数十万次数据交换;而混合架构将约90%的数据缓存任务交由HBF完成,使GPU负载降至原来的1/16。由此带来的提升不仅体现在效率上——并发查询能力提高18.8倍,同时系统整体能效比也稳定达到传统方案的2.69倍。 业内专家指出,这一进展的价值不止于单项指标提升,更反映了存储设计思路的变化:以往“金字塔”式存储层级正在被更灵活的垂直组合模式替代。SK海力士的路线表明——在AI场景下——单纯依靠硬件堆叠未必是最佳路径;通过不同存储介质的优势互补与智能调度,同样可能带来显著跃升。 不过,要实现大规模商用仍需解决若干关键问题。目前团队正重点优化中介层的时序协调能力,以缩小不同存储介质之间的速度差异带来的影响;同时,生产成本控制也将直接关系到该技术的推广速度与普及程度。

存储技术的演进往往会影响计算系统的上限。SK海力士H³混合架构显示,在摩尔定律放缓的背景下,依靠架构优化与系统层创新仍能获得可观的性能提升。这个方案为AI推理提供了更具成本效益的选择,也为未来芯片与系统设计提供了新的思路。随着技术深入完善并推进商用,H³有望在数据中心与AI基础设施中获得应用,推动人工智能产业走向更高效率与更可持续的发展路径。