数据中心巡检实操之UPS及电池

作者:*辉  唐国丰

UPS和电池是数据中心核心设施---IT设备的最贴身护卫,它们的重要作用于数据中心来说是不言而喻的。关于UPS的功能、原理本文不再细说,此类的文章汗牛充栋。本文以我们多年现场实操运维经验,来陈述UPS及电池是怎样巡检和管理的。

一、UPS及电池的巡检要点

1、节点及导体的发热

 “罗马不是一天建成的”,绝大多数的设备故障都不是突然出现的,在故障发生前一定有异常的讯号发出,那么发热是重要的表征特点之一,巡检前要对哪些节点重点关注,心中要建立起一份清单。

2UPS散热

电子技术的发展日新月异,高频UPS成为行业的主流,电路的半导体器件集成度越来越高,UPS各组件的物理尺寸越来越小但功率却越来越大,单位空间的发热量也就越来越大。良好的散热是UPS稳定运行的基石,UPS散热不好,会潜移默化般引发一系列故障。很多运维手册上都说,大型UPS在0~35℃温度范围可连续运行,到了40℃能连续运行8小时,推荐运行温度是20~25℃。由此可见UPS的正常运行对温度是很敏感的,也是有要求的,但依据我们的经验,我们想对这段话应该有个精确的诠释:UPS出风风扇口的温度为25℃左右。要达到这个指标,那么UPS进风口的温度以为18℃为最优。若UPS房采用全淹没制冷方式,则房间内的温度需要18℃。

3、电池漏液

电池漏液的原因:a、使用时电池输出电流太大,导致内部温升、液体膨胀;b、电极的消耗使电极四周密封空隙变大或密封材料老化;c、生产工艺缺陷或运输碰撞导致电池外壳ABS材料存在暗裂。电池漏液的危害主要有:a、电解液减少,会导致内阻增大,电池容量降低,缩短电池的寿命;b、影响电池组正常运行,造成停电事故;c、酸性溶液漏到金属电池架上形成接地通路,造成接地短路引发火灾。

二、巡检内容

日检(频次为一日两次)内容

  1. 查看监控中心的动力环境监控系统,是否有UPS和电池的报警、故障、参数异常等信息,包括输出功率、电流等有无异常的波动、电池内阻/电压有没有大幅度偏高等。特别说明:再好的监控系统也只是通过检测到信号参数达到目标阈值后,才及时发出告警信号,而数据中心稳定地、可靠地运行还是需要靠人对设备和系统认真多次巡检才能防范于未然。把对监控系统的查看放在巡检的第一步是为了对可能出现的警示信号进行快速的响应;
  2. 沿UPS房和电池房的主干通道及四周巡视一圈,感受环境的温度、湿度是否有异常;通过嗅觉能否体察到异常气味;查看温湿度计的数值;目光扫视天花有无异物掉落迹象;地面有无小动物入侵的痕迹;地面有无水渍;空调的风口有无凝结的露珠……
  3. UPS输入输出电柜面板指示灯是否异常,仪表是否有告警、故障信息,电流功率参数是否有较大波动,用手背感受断路器表面温度;
  4. 打开电柜面板,手背感受接口处电缆绝缘层的温度,查看电缆和断路器端接头,看颜色是否有无变化、涂层有无焦化、接头有无变形松动,必要时用红外点温枪复核重要部位的温度;
  5. 翻阅UPS控制器显示屏历史记录,有无故障、报警和异常等信息,可核实UPS本地信息和监控中心环境监控信息的一致性;
  6. 倾听UPS的风扇声、元器件的电频声等,是否有异常噪音,用手触摸UPS外壳感受其震动频率有无异常;
  7. 打开UPS柜门,查看进风过滤网有无积尘或粘附异物,用手电筒光线照射进去UPS内部核心部件、接线端子、板卡等处,查看涂层颜色是否焦化变色、接头是否变形、电容有无鼓包漏液等异常现象,嗅闻是否有异味等;
  8. 查看UPS排风口是否有异物、积尘程度,用手感受排风温度;
  9. 查看电池房环境时,重点关注电池架上空是否存在异物跌落的可能,尤其关注是否有可导电物体存在跌落的可能;
  10. 巡视每一排电池时,用手触摸电缆头和连接铜排的绝缘层感受其温度情况,注意嗅闻环境气味,如果有酸液冒出一定会有异于环境的刺激性气味;
  11. 查看电池有无破损、鼓包、划伤、移位、撞击变形等;
  12. 扫视每一节电池上方的单向排气阀,阀口附近是否有喷出的液体,如果有则说明其它部分排气阀存在堵塞现象,则需要清洗理或更换排气阀;
  13. 打开电池开关电柜面板,查看开关状态,手背感受开关体表温度、接口处电缆绝缘层的温度,查看电缆和断路器端接头,看颜色是否有无变化、涂层有无焦化、接头有无变形松动,必要时用红外点温枪复核重要部位的温度;
  14. 对巡检过程中发现的异常数据进行记录,异常的现象及时处理并记录,形成巡检档案;
  15. 巡检UPS配套的空调设施(以后再述);

周检内容

  1. 用3成干的洗抹布清理UPS进出风口积尘,清洁过滤网;
  2. 测试每台UPS关键部件的表面温度并做好记录;
  3. 用光电转速表记录每个UPS排风扇的转速,对转速大幅度下降的风扇要做计划更换;
  4. 认真全面查看每一节UPS电容器的外观状态,并做好记录;
  5. 清理每节电池的表面卫生,查看每节电池电极的颜色变化情况,如果有颜色异常,比如说在电极或螺母上析出一层薄膜蜡状物或白色小颗粒,则可判断该电池将存在冒酸的可能,应做好标识,加以重点关注;
  6. 测量每一节电池内阻、电压、电极温度,并做好记录;
  7. 每周核实一次电池室风机是否定时间点定时段自动启动;

月度/季度检查内容

  1. 检测记录UPS输入输出电压、电流、频率、负载功率等参数,查看并记录UPS同步及输出频率的稳定性,检查并机系统的每台UPS之间的负载均衡性;
  2. 检查并记录UPS输入/输出的电压、电流、功率、频率,输入额定电压要在-15%~+10,面板显示各个设定参数正常,控制精度正常,单机带载容量不能超过80%且并机负载均分性能良好,输出频率稳定;
  3. 测量并记录UPS电池电压和浮充电压、电流及UPS正常运行时的负载率;
  4. 在带载情况下测量并记录UPS输入/输出断路器、电池开关断路器、铜排、连接端子、输入、输出交流电容、直流母线电容、功率器件SCR、IGBT、接触器以及变压器等重要设备温度情况,并做好记录;

年度检查内容

  1. 对UPS用电能质量分析仪测试输入谐波电流(满载情况下3~39次谐波不大于5%),非满载情况下测试值要与说明书规定值或前次测量数据结果对比无明显变化;
  2. 确定外观、风扇、电容、电缆以及整流、逆变器(可视)板件,外观无变形破损,电缆接头无焦黄变色,电容无鼓胀漏液,板件无异常等。如有异常则进行维修、更换,确保最终所有部件正常;
  3. 仪表校正,实测电压、电流与显示对比没有过大误差;
  4. 检查主机、电池以及配电引线连接端子的接触情况,检查馈电母线、电缆及各个软接头等连接部位以及温升情况(接头处要没有明显的氧化变色、接触良好无松动、温度在正常范围);
  5. 测量UPS输出的零地电压值须小于2V;
  6. 对同UPS及电池相关的所有开关检查测试,开关分/合正常;
  7. 电池每年要进行一次核对性放电测试,放出额定容量的30~40%,三年以上的电池组每年要进行一次容量测试(注意电池充/放电时对电池温度进行监控,电池表面温升不得高于环境温度20度);

 

后记:看完文章后,想一想运维机器人该如何设计呢?呵呵!

数据中心巡检实操之UPS及电池

上一篇:南京伊顿UPS电源的正确维护5个方法


下一篇:全生命周期的智能化UPS系统 - 劲达 云UPS