问题——随着人工智能应用加速落地,模型参数规模和上下文长度不断扩大,训练与推理对数据吞吐提出更高要求。业内人士指出,计算侧能力提升很快,而存储容量与带宽提升相对滞后,容易形成类似“喇叭口”的数据通道瓶颈:数据供给跟不上算力消耗,导致GPU等计算资源难以满负荷运行。尤其推理环节,长上下文与高并发请求使缓存与中间数据占用明显增加,存储系统的容量、时延和稳定性,直接影响整体成本与使用体验。 原因——一上,主流大模型更依赖连续记忆和上下文推理能力,带来更大规模的KV Cache以及更高的Token吞吐需求;另一方面,数据中心能耗约束、机柜空间和运维成本压力下,需要更高密度、更高能效的存储介质。同时,运营商、金融与互联网等行业对数据安全、隔离与合规要求趋严,推动企业级固态硬盘在加密、虚拟化和可靠性上持续升级。 影响——存储短板不只影响单机性能,还会放大到集群效率与单位算力成本。随机访问能力不足或写入耐久不够,可能造成推理时延波动、训练任务排队甚至业务中断;能效偏低则会电力与散热上形成长期负担。对云服务与大模型应用提供方来说,存储系统的综合表现直接关系到每Token成本、服务稳定性以及扩容节奏。 对策——据长江存储在展会演讲与展台介绍,公司面向AI与高性能场景推出PCIe 5.0企业级SSD家族三款新品,统一采用新一代晶栈Xtacking 4.0架构,分别对应“容量密度、安全弹性、极致性能”三类需求。 其一,PE501定位超大容量QLC企业级固态硬盘,面向AI服务器与高密度部署场景,单盘最高容量可达122.88TB,顺序读取最高约14GB/s,随机读取达到3350K IOPS级别;能效上,读写能效分别约为700MB/s/W和167MB/s/W,同时提升耐久,DWPD约0.6,以更高密度与更低能耗满足海量数据就近存放需求。 其二,PE511为TLC产品,主打安全与业务适配,分为读写混合型与读取密集型,最高容量分别约12.8TB和15.36TB;安全层面采用盘级与主控级双层加密机制,并支持单根I/O虚拟化,可划分多达64个虚拟节点以提升资源利用率;耐久相较上一代提高,DWPD覆盖1至3,面向高负载与多租户环境强调长期稳定运行。 其三,PE522同为TLC产品,面向AI与高性能服务器,强调低时延与高并发响应,顺序读取同样达到约14GB/s,随机读取超过3400K IOPS,4K随机写时延低至5微秒级,性能功耗比达到100万IOPS/W;容量覆盖约3.2TB至30.72TB,耐久提升更明显,DWPD最高可达4,适配更严苛的写入场景。 除企业级产品外,长江存储还展示了消费级与嵌入式存储布局:消费级包括PCIe 5.0×4 TLC的PC550及PCIe 4.0×4 QLC的PC42Q;嵌入式涵盖UFS 3.1的UC341、UFS 2.2的UC260(推出512GB容量版本)以及eMMC 5.1的EC150,面向手机、平板、可穿戴与VR/AR等终端应用。 前景——业内普遍认为,随着推理服务规模化与多模态应用增长,数据中心将从单纯“堆算力”转向“算力—存储—网络”的协同优化。PCIe 5.0企业级SSD在带宽、时延、能效与可靠性上的提升,有望加快KV Cache下沉、冷热数据分层和就近存储等架构落地,推动AI基础设施向更高效率演进。同时,安全加密、虚拟化与可运维能力也将成为企业级存储竞争的重点,影响其在关键行业与多租户场景中的渗透速度。
AI时代的竞争,不仅是芯片算力的比拼,也是数据通道与存储底座的较量;谁能更好衔接“算得快”与“供得上、存得稳、用得省”,谁就更有机会在新一轮产业升级中占据先发优势。围绕容量、性能、能效与安全的企业级存储创新,将成为释放算力潜能、降低系统成本的重要支点。