在河南郑州这个地方,一家把PUE压到1.04以下的新超级计算中心终于正式投用了。这可是全国第七家用上液冷技术的超级计算中心呢,其他地方像天津、济南、长沙、深圳、广州和无锡也都有过类似的尝试。这家中心直接给行业树立了一个新标杆,把绿色计算的概念给实实在在地展示出来了。 其实超级计算这东西早就不只是在实验室里玩的高大上工具了。比如以前天气预报说局部地区有雨,听着就很含糊,现在直接能把每个小时的变化给你精准算出来。做生物信息数据分析,以前要算三天,现在只要几分钟就能搞定。还有自动驾驶技术,以后司机双手离开方向盘也变得可能了。 这些变化的背后,是因为计算能力一直在不断突破天花板。不过随着“东数西算”工程铺开,全国各地都在建数据中心,耗电量也跟着蹭蹭往上涨。大家都在喊着要双碳目标,绿色算力自然就成了大家争夺的入场券。液冷技术就是在这种情况下被寄予厚望的,它像一条隐形的路一样,直接把热量带走了,能耗也就降下来了。 液体和发热源接触的方式目前主要有三种:冷板式是让冷媒在铜管里循环;喷淋式是把水滴喷成雾状直接贴在芯片上;浸没式则是把整个服务器泡在冷却液里。从实测数据看,浸没式的PUE指标最好;要是再细究一下,那种需要相变蒸发的浸没式技术因为不用水泵而且密封要求低,稳定性就更高。 郑州的这个中心就是靠着这种技术把PUE做得很低的。服务器被专用冷却液包了个严实,热量很快就被带走了。机房里的空调基本上都不用怎么开了。在硬件方面,他们弄了一台叫“嵩山”的超级计算机。峰值算力能达到每秒10亿亿次浮点运算;存储容量有100PB;网络带宽是200Gbps;延迟也控制在微秒级别的水平。 在运营模式上也很方便。用户不用自己建机房、不用管空调、也不用操心维护的事。登录平台就能按核计费来申请CPU或者DCU加速卡。要是有大规模的DCU训练任务要做,系统早就把集群调度和网络优化都准备好了,“即申即用”特别省心。 从最开始“局部有雨”的模糊预报到现在的小时级精准计算;从实验室里的超级计算机到现在数据中心的液冷集群;技术一直在迭代进步。核心就是要让计算能力变得更环保、更普及、更贴近产业的实际需求。郑州这个中心不仅给中原带来了10亿亿次/秒的强大算力大脑;还用一份低于1.04的PUE成绩单告诉大家:绿色和高性能其实可以兼得。