你知道数据中心的清洁应该怎样做吗?| 运维进阶
【作者】赵蒙,2001年加入民生银行,多年数据中心运维管理经验,现任职于信息科技部机房管理中心,负责数据中心环境及消防安全管理工作。本文转载自“民生运维”。
常言道,“一屋不扫,何以扫天下”,意思是人要成就一件大事,就得从小事做起。“扫”说白了就是打扫卫生,做做清洁,的确不是什么传统意义上的大事,给人的印象就是:没什么技术含量,人人都会做,都能做,所以才会不屑于去做。殊不知,这打扫卫生的“小事儿”也要具体情况具体分析,要是一座庞大的数据中心摆在眼前,恐怕谁都要皱眉头,何况还是全天候运行中的数据中心。但也有不怕苦不怕累的能人,认为只要发扬愚公移山的精神,坚持就能成功,可事实并非如此。
首先要知道,为什么一定要做数据中心整体清洁。机房环境看似封闭、整洁,基本与外界隔离,新风系统保证机房环境处于正压状态,使灰尘难以进入。但随着运行时间的推移,设施损耗、人为施工操作和空气质量等因素,还是会对机房环境产生影响。因此需要在日常保洁之外,定期进行专业的整体清洁。

▲高架地板下残留的施工杂物

▲长期运行吸附在设备表面、主板及风扇上的灰尘
对运行中数据中心的整体清洁不但规模庞大、现场情况复杂,对于清洁度也有极高要求,在清洁过程中不但要保证清洁质量,更要确保机房内设备的正常运行。假如清洁动作不慎,会破坏线路;扬起灰尘吸入IT设备,会影响设备寿命;地板掀开超过3块,就会影响空调制冷回路,产生局部热点,造成设备宕机等等问题,因此就需要有非常专业的团队使用专用工具来进行这项并不简单的清洁工作。
我国数据中心环境指标,是依据中华人民共和国工业和信息化部发布的《电子信息系统机房设计规范》GB50174-2008中,对于A 级主机房的空气含尘浓度在静态条件下测试,每升空气中大于或等于0.5μm 的尘粒数应少于18000 粒的要求。机房内腐蚀性气体(氯化物、氧化物、硫化物等)不能超标,如果灰尘或者腐蚀性气体的含量比较高,湿度再高的话,会使电器设备的线路及主板发生短路,那么数据中心设备的故障率就会比较高。
目前国内数据中心行业进行整体、深度清洁维护工作的认知非常缺乏,方法手段也很落后。很多机房都是24小时不间断运行,由于担心深度清洁工作有造成设备运行中断的风险,就不做深度清洁维护。但是在国外,例如微软、苹果等大公司的IT数据中心,每运行一定周期,都会由专业保洁公司使用特殊设备及清洁材料,按照科学、规范的清洁方法进行整体、深度机房保洁,保洁后通过美国ISO14644-8体系的标准进行评测。

▲ISO环境控制标准
这次我中心实施的马坡(民生)数据中心机房整体清洁工程,由专业的保洁公司承接,内容涵括高架活动地板下部、地板表面,支架,机柜表面以及其他设备的清洁。清洁后的检测工作使用专业手持粒子计数器进行测量,自动生成测量数据,并出具专业的空气质量检测报告。

▲手持空气粒子计数器
专业保洁公司的工作方式,使我见识了清洁数据中心,从人员、设备到操作的专业性。清洁设备是从外地运输过来,加起来总共有650公斤重。


其中包括带有HEPA过滤系统的专用真空吸尘器、数据中心清洁专用工作服装、专用清洁剂(实验级异丙醇溶液、独家配方防静电地板清洗剂)、高纤维无纺布(防静电,不掉毛)、高纤维无纺布拖把、地板吸、宽视野头灯等物品。



人员进场后,首先要做的工作是换上专用防静电服和佩戴静电带进行保护;由机房运维人员带领熟悉现场情况;了解现场消防告警设备的位置及工作状态,以防止因触碰而引发的假火警警报;然后确定就近的清洁用水源位置;为清洁仪器指明可使用的电源位置;确认最近的紧急出口位置。

▲施工人员进场后更换工作服装,准备清洁设备
清洁工作从测试机房开始,因为测试机房面积较小,设备重要级别相对较低,可以先熟悉现场环境及操作流程。之后依次对9个模块机房、空调间、UPS配电间、电池室等区域进行实施。清洁步骤遵循从上到下的方式,先从网线桥架开始,再到机柜外部清洁,然后是地板上表面清洁及打磨,地板侧面清洁,地板背面清洁,地板金属支架及横梁,最后是地板下地面清洁。
网络桥架的清洁使用GD5背负式吸尘器,配以防静电毛刷吸头,对桥架,线槽,进行除尘作业,全程不大力触碰线材,避免一切因线缆松动而可能产生的数据风险。

▲网络桥架清理现场
自上而下,进行机柜外表面清洁,使用GD5背负式吸尘器,配以防静电毛刷吸头,对机柜顶部,及机柜四周进行除尘作业,使用沾有异丙醇溶液的防静电无纺布,对机柜进行整体擦拭工作,所有的擦拭作业要严格遵循不触碰线缆的准则,以防止设备掉电的风险。



▲机柜顶部清洁前状况

▲机柜顶部清洁后状况

▲清洁前后对比
接下来是防静电地板上表面清洁及打磨,地板侧面清洁,地板背面清洁,地板金属支架及横梁,以及地板下地面清洁。使用对地板无损的真空吸盘抬起地板,然后用无纺布配以全球地板厂商及各大数据中心实验室公认的对地板无损清洁液,异丙醇溶液,进行反复擦拭,确保地板表面、背面及地板四周的清洁。

▲模块机房区域地板下清洁

▲电池室地板下清洁
由于IT机房采用地板下送风方式,如果掀开地板过多,做清洁时,制冷气流会从开口快速散开,不能充分吹入IT机柜,就会使IT设备迅速升温,产生局部热点,出现宕机的可能。因此,经过计算及实践检验,为了不影响设备运行,每次打开的地板数量不应超过两块。

▲掀开地板过多的非专业操作方式
此项工作由两人一组,熟练配合。地板掀开后,一人负责擦拭表面、侧面、背面灰尘,另一人使用GD930 配以 GM80 真空吸尘器进行地板下垃圾清理。如遇吸尘器无法吸入的垃圾,用人工捡拾的方式进行取出,再用无纺布配以清洁剂对地板下的保护金属板表面吸附灰尘进行擦拭,确保地板下环境的清洁。

▲地板清洁前后对比

▲地板下清洁前后对比
地板下清洁工作完成后,将所有地板恢复原状,对部分不平整的位置进行调平后,使用异丙醇溶液配合专业的无静电地面清洁拖把,由 5 名工人按顺序进行擦拭,确保地面的清洁。对于施工或其他问题造成的,粘附在地板上的顽固污渍,使用防静电刷及无纺布,由工人进行手工去除。最后,再使用电动抛光机对地板表面整体抛光。至此,一个物理区域的清洁工作整体完成。

▲地板清洁抛光
按照以上工序,逐一对所有9个模块机房、空调间、UPS配电间、电池室等区域的房间进行清洁。清洁完成后,再次使用手持粒子计数器对区域内空气质量进行测量,生成室内空气质量检测报告。同时采用空气检测挂片对室内空气中可能对设备造成不良影响的的氯化物、氧化物、硫化物和未知污染物物质进行检测,生成分析报告。

▲悬挂在B机房的空气检测挂片和美国PureAir实验室
空气检测挂片上装有铜片和银片,在检测位置悬挂30天,之后取下寄到美国的PureAir检测实验室进行腐蚀性检测,得出检测区域空气中污染物的含量,并出具检测报告。报告给出质量评级,可作为检测区域的空气质量依据。马坡数据中心空气质量检测报告结果不但满足国标要求,还达到ISO14644-8 AIR认证标准,因此,我中心也申请并获得了ISO14644-8 AIR认证证书。


在2019年6月Uptime institute官方对于马坡数据中心M&O运维体系认证项目的审核评价中,关于机房清洁度的描述如下:“机房格外的清洁,定期进行整体清洁工作,数据中心内无可燃物、清洁工具、纸箱以及个人物品等杂物。清洁的机房环境是数据中心团队坚持执行着极高运行标准的最好证明”。
我中心计划每两年组织一次数据中心整体、深度清洁工作,确保机房整体环境始终处于良好的运行状态,保证各IT设备在良好的环境中运转。
专业的人做专业的事,数据中心运维工作更要遵循这条原则,即使是机房清洁这种日常工作也能体现出一个团队的专业性。所以,数据中心的清洁你知道该怎么做了么?
原题:你知道数据中心的清洁应该怎样做么?