我给大家讲讲安科瑞数据中心是怎么处理供电保障问题的。某数据中心给两家银行服务,那次出事是两路外市电同时降了快50%,几秒钟就跳闸了,32台10/0.4kV变压器的断路器都跟着跳了。因为柴油发电机还没来得及启动,而且没法直接给0.4kV母线供电。运维工程师动作慢了一拍,导致UPS电池都没电了还没合上闸,两家银行的业务都受了很大影响。 这次事故主要是因为保护设置错了。一般这台变压器综保装置是不投欠压保护或者只告警的,结果这儿设置成跳闸,一电压跌就全跳。系统容错性也不够,0.4kV侧通常没备自投装置。再加上没有专业工具和训练,穿防护装备、找开关柜位置耽误了时间,错过了恢复供电的好时机。 安科瑞能从进线到末端配电给一套解决方案。他们提供110kV、10kV、0.4kV的保护装置和备自投,经验也很丰富。大型数据中心最好用高电压电源,至少两路市电冗余进来。每路电源得满足全部一、二级负荷需求。正常时两路都开着,出现问题能自动切到另一条线。 为了提高容错性,0.4kV侧最好也装个备自投装置。我有个例子是三路10/0.4kV变压器进线、两路母联和两路柴发进线组成的系统。有两个低压备自投装置AM5-DB采集三路站用变进线电压电流、两路柴发电压还有各断路器状态信号。它们控制7个断路器的合闸分闸和两个柴油发电机的启动信号来完成切换控制。 还有一个动环管理系统AcrelEMS-IDC能监测高、中、低压配电系统、柴油发电机、UPS还有末端机柜配电情况。它帮着分析PUE值,提供异常预警、远程操作这些功能来缩短故障时间。系统对故障类型分级处理,通过语音、短信这些方式通知管理者。 最后说一句,数据中心供电系统的可靠性太重要了。现在算力高、负载密度大,科学的架构设计、完善的运维体系和智能化管理系统支撑是关键。这样才能挡住断电风险实现零非计划停机。