最近,亚马逊阿联酋的数据中心被无人机炸了,让我们意识到了数据中心安全设计的重要性。这次事件让我想起了最近AI应用的爆发式增长,AI对算力的需求越来越大。过去小一点的算力中心已经不够用了,所以大型数据中心就应运而生。 数据中心主要是给我们提供强大的算力支持,通过这些算力可以完成各种大模型的训练。现在大部分吃算力的应用都是与AI相关的。数据中心和算力能力都是相辅相成,一个数据中心里面有几千张甚至上万张显卡并不稀奇,很多都是千卡级别的集群。除了显卡外,还有UPS、液冷散热供电等配套设施。 人类文明不断进步,AI在我们生活中的应用也越来越广泛,数据中心对我们日常生活影响巨大。如果一个数据中心出了问题,可能导致很多AI应用无法正常运作,造成算力不足和异常情况发生。 最近阿联酋亚马逊一个数据中心被炸就是一个例子,这次爆炸给该区域带来了短时数据断联。别小看这个短时断联,有些地方一分一秒都不能断。这次事件带来的损失很难估量。 单就数据中心本身来说,里面的显卡每张都要好几万块钱,更何况还有千卡万卡的集群建设。这样看来损失是非常巨大的,还没有计算上给服务带来的影响。用几架无人机去换一个价值连城的大规模数据中心,这笔买卖谁会愿意去做呢?