制冷主机简称冷机,是数据中心空调系统的重要组成部分,其载冷剂一般为水,简称为冷水机组,其冷凝器的冷却利用常温水的换热降温来实现,故也称为水冷机组。数据中心冷量需求大,选用离心式机组可以获得较好的能效,本文的冷水机组专指离心机组。离心式制冷压缩机是一种回转式速度型压缩机,吸气管将要压缩的气体引入到叶轮入口,气体在叶轮叶片的作用下跟着叶轮做高速旋转,通过叶轮中的叶片对叶轮槽道中的气体作功,提高气体的速度后引出叶轮出口处,然后导入扩压腔;由于气体从叶轮流出后,具有较高的流速,为了将这部分速度能转化为压力能,在叶轮排气口外侧设置了流通截面逐渐扩大的扩压器,进行能量的转换,以提高气体的压力;扩压后的气体在蜗壳里汇集起来后,进入机组的冷凝器进行冷凝,以上这一过程就是离心机的压缩原理,如图1;另外为了冷凝和把冷量带走,空调系统包括冷却水系统和冷冻水系统。
离心机组组成如下:包括离心压缩机、蒸发器、冷凝器、节流孔板、供油装置、控制柜等组成,如图2、图3所示。其中压缩机主要由吸气室、叶轮、扩压器、弯道与回流器、蜗壳组成。
制冷量大。由于离心式压缩机的吸气量不能过小,因而离心式压缩机的单机制冷量都较大。结构紧、重量轻、尺寸小,因而占地面积小。在相同的制冷量下,离心式压缩机的重量只有活塞式压缩机的1/5~1/8,冷量越大,越明显。易损件少,可靠性高。离心式压缩机在运行过程中几乎无磨损,因而经久耐用,维修运转费用较低。离心式压缩机中的压缩部件为旋转运动,在径向受力平衡,因而运转平稳,振动小,无需专门的减振装置。能够经济地进行冷量调节。离心式压缩机可以采用如导流叶片调节等方法,使能量在一定的范围内调节。易于实行多级压缩和节流,可实现同一台制冷机多种蒸发温度的操作运行。冷机在建设和调试中会遇到一些问题,运行中也会发生故障,这些问题和故障的处理方法关系到数据中心运维的安全,下面是冷机建设和运维中发生的一些案例,相关处理方法和心得,仅供参考。某数据中心需要对冷机进行调试和试运行,但末端空调设备安装还未完成,现场也缺少必要的假负载,调试工作无法进行。 数据中心离心机组安装完成后,机房末端设备没有安装,末端冷冻水路不通,冷机无法调试;即使通过分集水器进行冷冻水旁通,也仅仅使冷机能够开机运行,缺少热负荷,或者热负荷过小,无法达到冷机下限负荷,调试工作无法进行。另一方面,由于冷机未调试,主机房服务器设备无法加电运行,相互形成一个死循环;另外调试过程中,需要的假负载功率巨大,运行过程会耗费大量电能;上述因素导致冷机调试成为一个难题。 采用无负荷调试方法进行调试。这个过程,就是充分利用板换的换热能力,把冷机蒸发器产生的冷量通过板换交换到冷机冷凝器侧,把冷机冷凝器放出的热量通过板换交换回到蒸发器侧,从而达到冷机冷量和热负荷的完全匹配,冷却塔只带走压缩机的轴功率。采用这个方法,很容易就达到不同负荷下的综合效能测试,冷机板换调试水路循环如图4所示。
开启分集水器中的旁通阀门,在末端空调没有安装的情况下,确保水路畅通形成循环;全开冷冻水侧冷机和板换阀门,确保冷机和板换水路畅通,冷机制取的冷水和板换换回的热量可以顺利混合;正常开启冷冻水泵,手动调整频率为45Hz以上,并确保水路循环正常;
全开冷机冷却水阀门,部分开启板换冷却水侧阀门,开启冷却水泵,确保水路循环正常,调整水泵频率为41~45Hz;先不开启冷却塔风机;冷冻水和冷却水正常情况下,开启冷机,进行单机试运转;根据板换冷却水阀门的开度调节板换的换热能力,阀门的开度在1/4到全开之间进行调整;根据冷却水水温情况部分开启冷却塔风机,以能带走压缩机轴功率为准。 数据中心为了降低能效,考虑自然冷却,一般采用冷却塔+板换供冷技术设计。调试时可以利用板换的换热能力,从冷机的冷凝器获得足够的热量作为冷机调试的热负荷,也就是冷机产生的冷量通过板换带走。 无负荷调试原理就是充分利用板换的换热能力,把冷机蒸发器产生的冷量通过板换交换到冷机冷凝器侧,把冷机冷凝器放出的热量通过板换交换回到蒸发器侧,从而达到冷机冷量和热负荷的匹配,这种方法操作简单,实施方便。 冷机调试完成后,需要正式运行,但冷机总负荷偏小,冷机启停频繁并发生喘振现象。 系统设计有蓄冷罐,可以通过蓄冷罐充冷和放冷的工作方式,控制冷机合理的启停频次,避开冷机的低负荷喘振区域;如果系统没有蓄冷设计,可以采用低负荷运行方法进行运行。 采用蓄冷罐蓄冷技术和板换作为假负载技术,通过合理操作和流量控制,可以确保冷机运行平稳,成功度过低负载时间。 某数据中心运行过程中,冷机房突发消防烟雾报警,消费人员发现消防报警后,进入冷机房查看,发现一台冷机运行过程中轴封处喷出大量白色烟雾。 该冷机为开启式冷机,冷机运行过程中轴封处突然发生泄漏,由于泄漏量较大,触发了消防告警。消费人员不懂空调专业知识,将冷机泄漏的制冷剂误为冷机起火产生的烟雾。 对泄漏的冷机进行维修,更换轴封O形圈和C环,清除制冷主冷机上的干粉残留物,保压、检漏、抽空、加氟调试后恢复正常。 某品牌的机组,采用开启式压缩机,轴封处泄漏故障较频繁,发生泄漏,正确的应对措施是先对机房通风,再关闭冷机,泄漏过程需要保证冷冻水泵和冷却水泵的正常运行;如果冷机机组处于停机状态,必须马上启动机组对应的冷冻、冷却水泵,保证机组水系统有水流动;否则两器的换热铜管会冻结破裂,导致更大的故障。进入机房采取紧急措施的人员需要做好个人防护措施,并且及时将故障通知维保单位。 某数据中心一台冷冻机组运行过程中发生制冷能力下降现象,后触发冷机低压告警,机组外部检漏正常,采用肥皂水溶液涂抹到怀疑有渗漏的部位,冷凝器、压缩机、蒸发器之温度传感器、压力变送器、维修角阀、安全阀等丝扣连口及其它部位,未发现漏点,怀疑蒸发器内有泄漏,打开端盖查漏,确认为冷机蒸发器发生泄漏。 现场检查发现蒸发器进水口处有金属环状物卡在蒸发器铜管处(图5),在长时间水流流动的推力下,弹簧圈发生震动,蒸发器换热铜管被磨破,导致了系统的泄漏(图6)。 冷机设计时,需要在冷凝器和蒸发器进水侧分别配置Y形过滤器,本案例冷冻水回路未配置Y形过滤器。恰巧水泵机械密封弹簧断裂,由于缺少过滤器的保护,断裂弹簧直接进入机组蒸发器,并停留在换热铜管和管板结合处,在水流的长时间冲击下,断裂弹簧和铜管发生摩擦,磨穿了铜管管壁,导致冷机发生泄漏。 补漏方法:找出泄漏的管子,作好标记,维修时抽出旧换热管,更换新管后在端板处进行胀管,再进行检漏和气密试验;如果泄漏的管子比较少,也可用堵头将该铜管两端堵死。现场考虑只有一根铜管泄漏,就在该铜管两端进行了封堵,经查漏、抽空重新加注制冷剂调试后,冷机恢复正常运行。 正常情况下冷机的蒸发器和冷凝器进水侧都需要设置过滤器,本案例就是因为绝对冷冻水侧过滤器用处不大,设计时图省事,取消了过滤器配置,运行中机封弹簧断裂进入冷机蒸发器内,长时间和铜管管壁摩擦发生泄漏。所以水系统细节设计上,不能图省事,否则会带领不必要的麻烦。 某冷机运行过程中发现导叶异常告警,现场实际工作位置与控制中心显示位置存在较大偏差(图7),无法正常工作。 导叶机柜故障,常见故障为导叶马达断轴,或导叶启闭不到位,考虑该冷机搬运中被拆卸和重新组装过,所以重点检查装配问题,检查传动链条松紧度,检查齿轮锁紧螺钉是否牢固,检查驱动电机主绕组工作电压(AC24V)是否正常等,发现均正常。 考虑执行器工作电压正常,传动链条松紧度正常,齿轮锁紧螺钉牢固无松动,尝试着更换执行器后,故障消失,故确诊为执行器工作异常。现成对导叶执行器进行重新校正并测试,确保开度信号与导叶电机实际开度基本同步。 本案例故障并不复杂,是执行器工作异常导致,由于冷机被拆卸过,所以重点怀疑导叶驱动和执行器的组装问题,走了点弯路。 某冷机运行中,突然发生低流量告警,导致冷机停机,制冷中断,尝试消除故障,发现低流量告警故障一直存在,冷机无法开启。 现场检查水泵运行情况、冷机阀门开启情况和流量情况,均正常,而流量开关触点始终呈现开路,无法闭合,怀疑流量开关存在问题。 现场停泵,关闭流量开关两端阀门,拆卸流量开关,发现靶式流量开关已经折断损坏,更换流量开关后,冷机正常开启和运行。 流量开关,也叫水流开关,是保障空调机组正常运行的重要措施(图8、图9)。当水泵或阀门故障时水流开关能及时切断机组的控制回路防止蒸发器压力过低及冷凝器压力过高;水流开关保护是机组重要的保护功能,水流开关损坏要及时更换;另外日常维护中注意检查,避免水流开关、高低压开关、安全阀等保护装置的失灵而引起的故障或事故。
某小型数据中心冷机运行过程中发生高压故障停机,复位后重新开机,不久又触发高压停机,停机前冷机伴有严重喘振现象,维护人员反映停机前发生多次较严重喘振现象。 复位后开机,发现冷凝温度偏高,运行过程中有多次喘振现象,通过咨询了解,冷机负荷率80%时,冷却水温进33℃,出37.5℃,水温偏高,检查小温差为6℃,严重偏大,对应冷凝温度为43.5℃,根据上述数值判断,冷机高压原因为冷凝不良和小温差过大。 通过现场了解发现,该数据中心值班人员基本从事普通电工工作,只会进行简单的开关机,对暖通和水系统维护比较陌生,相应的维护和保养没能贯彻和执行。故初步判断冷却水系统需要水质处理和维护,冷却塔、冷却水系统过滤器和冷机冷凝器需要进行局部清洗,冷机机组也需要正常维护和保养。 现场先进行冷机保养,更换了冷冻油和过滤器;再进行冷却塔维护,更换调整风机皮带,调整风车倾角角度,对冷却塔填料和冷却塔水盘进行清洗维护,更换冷却塔部分填料,并进行水质处理;之后拆洗水系统管路上所有的过滤器,系统投入运行,冷却水温进29.1℃,出34.5℃,冷机小温差也只有1℃,喘振和高压现象消失,系统恢复正常运行。 运维人员要了解水系统的基本知识,熟悉水系统的特点,掌握水系统的维护方法和基本步骤,并形成维护的制度化,管理人员也要知道水系统的维护要求,并落实资金。水系统的生命周期,可以说是“三分建设、七分运维”。 某数据中心3号机楼采用某K品牌冷机,和4号机楼另一品牌冷机同年投入使用,但在使用中发现,同样的维护方法和频次,冷机运行状况相差较大。如同样每3月一次化学清洗,3号机楼的冷机仍旧会发生小温差过大情况,主要表现在机组的冷凝温度偏高,尤其在夏季运行时,由于冷却水的出水温度较高(35℃),温差一大,机组的冷凝温度极易超过39℃这个临界点,机组会产生喘振现象、效率降低、甚至保护停机,由于机楼负荷较大,影响机房运行安全。 经过多次比较,发现该品牌冷机的冷凝器相比较另一品牌冷机冷凝器换热能力明显要弱,相同的水处理方法和处理频次,但小温差温升变化情况明显要快,从侧面也验证了换热能力较差这种可能,但该冷机厂拒绝承认冷凝器换热不良或者配置偏小的事实。 和厂家多次交涉,最后给出的方案是由厂家负责冷机的清洗。冷机停机关闭阀门卸压后,厂家技术人员打开冷凝器端盖,采用机械通刷法清洗,现场经过物理清洗后,冷凝器换热不良导致小温差过大问题暂时解决。 喘震是离心机组的特有现象,是制冷剂在压缩机发生一种倒流现象,喘震发生时,制冷剂从冷凝器倒流,经过压缩机回流到蒸发器。当制冷剂回到蒸发器之后,冷凝压力下降,蒸发压力上升,压缩机开始再次按正常方向工作。但是,随着冷凝压力的升高,蒸发压力的下降,机组将再次开始喘震。当负荷降低时确保冷却水进水低温;负荷增大时要确保合适的进水温度和合理的小温差。增加局部清洗频次,虽解决了小温差过大的问题,但增加了换热铜管损伤的次数,降低了冷凝器的寿命。事后了解,该冷机换热铜管采用内外螺纹技术,可以提升换热效果,新机情况下可以减少部分换热面积,但是使用一段时间后铜管结垢,由于没有额外的换热面积导致冷机提前出现换热不良的情况,建议大家在冷机采购时给予关注。 某行业数据中心自用冷机房,某台冷机运行过程中运行电流突然增大,并发出严重异响声音,值班人员发现情况后停机。 现场检查,从故障菜单中发现该冷机故障前曾经发生过多次的高压故障和高油温告警,检查冷机冷冻油,发现油品颜色较黑,并发现油里含有金属屑,需要开机大修检查;拆机解体后检查,发现冷机高速齿轮轴承严重磨损(图10)。 询问后了解,该数据中心的冷机和水系统运维交给物业代管,物业对水系统缺乏足够的了解和重视,也缺少专业的技术人员和维护力量,对水系统维护的维护处于空白状况,常规的冷却塔维护和水处理工作基本被忽视,常规的冷冻油更换没有进行,运行过程中冷却水温多次偏高,加上现场小温差明显偏大,导致冷机长时间工作在过载情况下,出现多次的高油温和高压告警,物业对这些告警也没有重视,处理上述故障的方法是复位后重新开机,持续的故障运行导致冷机齿轮和轴承发生严重损坏。 对离心压缩机返厂大修,更换冷机增速齿轮对和轴承,更换冷机润滑油油和滤清器,并对水系统进行水质处理和冷却塔填料进行清洗,之后冷机调试正常,运行正常。 冷机需要定期维护和保养,特别是润滑油和滤清器需要定期更换,冷却塔和水系统也需要定期维护和保养,确保良好散热,如果维护不跟上,带病运行,特别是高油温或者缺油运行,会润滑不良导致严重故障。冷机保养过程包括:更换油过滤器;检查油系统回路,更换回油引射过滤器;更换压缩机润滑油;检查并补充制冷剂;检查和清理控制柜; 检查和清理动力盘;检查机组控制设置值是否正常等,如图11、图12所示。
某冷机运行过程中,一台冷机的冷却水发生低流量控制器动作,冷机停止工作。 发生流量告警故障,一般常见原因如下:水泵工作发生异常、过滤器堵塞导致的低流量,也可能是流量控制器故障或者设置值异常。 现场检查,发现水泵运行正常,两端阀门工作正常,但Y形过滤器两端压差异常,明显偏大,判断为Y形过滤器堵塞。 停水泵,关过滤器两端阀门,泄压后对过滤器进行拆卸(图13),发现过滤网上有脏污导致堵塞,清洗重新安装后(图14),开启冷却水泵,冷却水流量恢复正常,流量开关无告警,冷机正常工作。 水系统的维护非常重要,需要定期维护系统中所有的过滤器,本案例就是没有定期清洗水管管路上的过滤器,导致了冷机流量告警停机。 有金融业的省级数据中心发生末端空调制冷效果普通偏差的现象,后来检查发现管路安装过程中,没有对管路进行合理的防护,导致管道中污染物太多,加上清洗不及时,系统还未正式投运,过滤器就被完全堵塞的情况,空调无法工作。 某冷机房空调系统管网刚建设完成,在进行打压试验过程中,突然发现冷机发生严重位移,被伸长的波纹管推下基座。 系统打压时,软接头发生严重伸长,导致冷机发生横向位移,刚好冷机也未完全固定,从基座上被推到基座下面。原来施工队打压试验时,未隔断波纹管和冷机设备,直接打压,由于打压压力较大,波纹管严重伸长,并推动冷机发生水平位移,冷机一侧掉下基座。 关闭阀门,拆卸和冷机相连的管道,将冷机重新恢复到原来位置,检查冷机正常,无明显异常后才放心,更换严重伸长的波纹管,重新连接管道,系统恢复正常。 管道水压试验前,要按设计施工图进行核对,有可能对试压造成影响的环节进行检查,对不能参与试压的设备与阀件,需要加以隔离。现场可以根据需要安装试压临时管线、试压仪表及设备。 某数据中心为提升制冷系统配电的可靠性,决定对冷机、水泵配电进行全面升级,采用双电源+ATS切换,现场进行配电和电缆改造施工,冷机配电改造采用逐台进行,发现其中一台冷机配电改造重新开启不久,出现油温严重异常停机。 现场检查,电源电压正常,测试相序,发现电缆施工过程中,其中一台冷机配电相序发生了改变,而冷机本事没有相序保护,冷机启动后,电机反转,导致油温和排气温度异常升高,这是因为润滑油在进入压缩机之前,需流经制冷剂冷却的油冷却器,冷机反转后,无法正常制冷,所以油温也会严重升高。 该故障原因为更换电缆后未确认转向,导致压缩机反转,反转后导致油压异常,最后停机。对冷机停电后,更换进线电缆相序,对冷机检查后,尝试性开机,一切正常。 电缆施工后没有进行相序核对,导致冷机反转,好在运行时间较短,没有对冷机造成损伤,实属万幸。社会上用户曾经发生过用户自行调换电缆,未确认转向,导致压缩机反转,最后导致高速齿轮大面积损坏而报废的严重故障。 某数据机楼中,配置4台冷机,日常运行三台冷机,其额定COP均为5.5。但实测发现,即使在满负荷工况下,这三台冷机也达不到额定值,其中最低一台仅为3.5,最高一台为4.5。 离心机组COP偏低的原因,常见问题有冷机负荷率偏小,设备性能老化等,冷机和冷却塔效率偏低导致冷却水回水温度偏高等。现场检查,每台冷机制冷量为2037kW,而实际每台冷机供冷量只需要1500kW,低负载率导致了低效率;另外一个原因是设备性能老化,机组长时间运行中,冷却水质处理不及时,冷机和冷却塔换热效果较差,导致效率降低。 现场对冷机和冷却塔进行清洗,并进行水质维护;也对冷机工况进行调整,补充部分制冷剂,正常维护后,冷机COP达到5.3左右,恢复到额定值。 运维中要关注最大冷负荷工况下的冷机COP瞬时值与冷机额定COP,对节能减排非常重要。如果前者明显小于后者,说明冷机效率低下很可能源于设备自身的原因,需要找到原因并进行处理。
数据中心水系统较为庞大和复杂,一旦水系统故障,影响和波及面大,检修也不易,希望上述冷水机组案例经验对数据中心的建设和运维人员有所帮助,避免重蹈覆辙,从而提升数据中心的安全性。