海力士推出了一种创新的混合存储架构，名为h3，这款架构给我们展示了怎样有效提升ai 系统的计算能力。

在 AI 技术快速发展的时代，海力士推出了一种创新的混合存储架构，名为 H3，这款架构给我们展示了怎样有效提升 AI 系统的计算能力。H3 的设计非常巧妙地结合了 HBM 和 HBF 这两种存储介质，把它们各自的优势发挥到了极致。在 AI 的学习领域，比如大规模语言模型（LLM）推理任务中，大量数据需要被读取和处理。H3 的设计让只读数据被存储在 HBF 中，而其他数据则存放在 HBM 里。这样一来，就充分利用了 HBF 容量大的优势，同时避免了它访问延迟高的短板。具体来看，H3 把 GPU 与 HBM 的 Base Die 通过中介层连接起来。HBM Base Die 内置了 HBM 控制器和与 HBF 系统配套的“延迟隐藏缓冲”。而 HBF Base Die 则负责管理整个 HBF 堆栈。这种配置给 LLM 推理带来了巨大的好处，特别是在那些需要频繁读取共享预计算键值缓存的场景中。仿真测试结果显示，使用 H3 架构的 GPU 系统，单位功耗下的吞吐量提升了 2.69 倍。 SK 海力士在这次研究中提到了 HBF 和 HBM 的特点：HBF 的带宽与 HBM 相当，但容量更大、访问延迟更长、写入耐久更差、功耗也更高。因此，在设计 H3 时，他们把 HBF 作为 HBM 的“二级扩展”。这种混合存储方案为 IT 行业提供了一种高性价比的解决方案。特别是在处理那些具有海量只读数据的任务时，这个架构表现得非常出色。这份论文发表在本月 4 日，是 SK 海力士给出的最新研究成果。通过智能数据分配技术，H3 成功实现了带宽与容量的双重提升。这个设计理念不仅为 AI 计算时代提供了新的思路，也让大家看到了存储技术在推动 AI 发展中的巨大潜力。