数据中心“上路”前需要第三方测试验证?
摘要:数据中心验证是业主对于数据中心建造质量进行确认的一个过程。在欧美的建筑行业,验证作为工程质量管理的规定步骤已经存在了30多年。近10年来,欧美的数据中心客户也已经把验证作为数据中心工程质量管理的规定动作了。国内近几年建设的大型数据中心也都开始把验证作为必须的要求。 |
数据中心验证的定义——ASHRAE的观点
ASHRAE 美国采暖、制冷与空调工程师学会认为,数据中心验证是一个系统性的质量验证过程。此过程验证并记录该数据中心设施作为一个整体及其所有的设备、子系统满足用户的设计目标和运行要求。
作为全球最有影响力的行业组织,ASHRAE更看重数据中心验证过程的重要性。数据中心验证是业主对于数据中心建造质量进行确认的一个过程。在欧美的建筑行业,验证作为工程质量管理的规定步骤已经存在了30多年。近10年来,欧美的数据中心客户也已经把验证作为数据中心工程质量管理的规定动作了。
国内近几年建设的大型数据中心也都开始把验证作为必须的要求。但相对起国外,行业人士预计还有80%的国内数据中心没有聘用专业的第三方机构进行数据中心的验证。这为数据中心稳健运行埋下了隐患。
而从数据中心项目实际进展的角度,规划、设计、建设阶段投资大,周期长,验证是确保投资达到预期目标的最重要的手段,也可以看作数据中心建设的终点。与此同时,验证是数据中心运行的起点。一个专业和完善的测试验证可以极大降低数据中心在其运行早期的故障率,并为其全生命周期的稳健运行奠定基础。也就是说,数据中心验证过程发生在工程竣工和投产之间的关键节点,这个节点也直接决定了数据中心前期投资和后期运行能否按照规划顺利实现。
基于大数据导致业务量激增和数据中心能力不断增强的双重需求,无论是以金融业为代表的注重自身业务持续性的行业用户,以互联网、运营商为代表的希望通过数据中心扩展业务收入的行业用户,以地方政府为代表的以产业园模式介入数据中心产业发展的新兴用户,还是以提供数据中心服务为己任的老牌IDC提供商们,都需要全程参与数据中心的从无到有。而用户自身参与的过程也为数据中心项目带来诸多潜在风险,最值得引起重视的风险包括前期数目巨大已经投入的投资风险和后期业务对数据中心潜在的严重依赖风险。
数据中心验证的价值——为什么要做?
以汽车为例子,在生产线上有严格的质量管理,出厂前也有厂验。所有汽车在从组装线下线之后、交付用户之前,需要经历整车综合测试、道路测试。同时,对于每个车型要做碰撞实验,以模拟最坏情况下汽车整车的应对能力。只有那些通过了所有上路实际测试的车辆,才能让我们放心驾驶。
数据中心建设和汽车有很多相似之处。安全(可靠性和可用性)也是头等大事。未经测试直接投入运行的数据中心,未必立刻出现故障,但存在用户自己也无法掌握的隐患和风险。经过对行业案例的分析比对,专家认为,忽视数据中心验证过程会增加风险变成事故的几率。举例来说,北京某知名数据中心,投产前因工期紧张等原因未进行测试验证。在运行一段时间后,用户希望对A路UPS 进行保养,在操作断开A 路断路器的时候,不幸的是,B路UPS 却被切断,导致系统中断,也因此付出了数额不菲的经济代价。
由此可见,只有在投产前进行全面的测试验证才能发现全部问题,排除定时炸弹。数据中心验证作为项目必须经历的重要过程,应该引起国内用户们的足够重视。
通常情况下,客户会要求具备相关能力和资质的第三方公司针对包括供配电、安防、空调、监控、环境、布线、线缆、防雷接地等子系统进行设备测试、系统内测试、系统联调、和基于故障模拟的集成测试。
高端客户更看重基于故障模拟的集成测试,模拟极端情况,测试系统实际抗故障能力:模拟发电机故障以测试容量及冗余能力,模拟市电故障测试转换开关和发电机性能,模拟UPS 故障测试UPS 冗余能力,等等。
可以说,数据中心验证作为检测必备环节,正在成为每一个数据中心建设工程的标准流程。
验证能够有效帮助后期正常运行,对项目实际运行、后期运维和可能的事故预案都有着非常重要的作用。
测试验证过程通过多层级测试、模拟多种情景来帮助发现系统可能存在的问题,并且针对薄弱环节进行整改,减少实际运行的故障隐患,提高系统可靠性,保证项目前期投资;
另外,验证过程所实施的大量测试工作,为运维团队提供了提前参与项目管理的机会,使得运维团队对系统更加熟悉,并且掌握了一定的解决问题能力,便于后期对数据中心的全面管理;
更为重要的是,针对关键设备、系统内、系统间及基于故障模拟的集成测试的验证过程,为业主提供了大量真实有效的测试数据,为将来数据中心的各项操作提供了全面的数据支持,也为业主完成标准化管理流程和运维预案提供了价值素材。