【技术分析】数据中心容量规划分析

1

引言

随着新基建政策的提出与推进,数据中心建设呈现迅猛发展态势。面对不断变化的应用环境和日益增长的业务需求,如何去规划一个数据中心是目前很多客户关心的问题。
数据中心规划是根据客户现有业务环境和未来业务目标,制定数据中心关键基础设施架构,有效支撑业务系统。容量规划是数据中心规划的核心内容,通过对电力、冷却和空间三者之间解耦,进行容量规划,在电力、水等资源有限的情况下,以满足客户使用为前提,使空间与资源得到充分利用,降低客户成本。

2

容量规划的必要性

数据中心容量规划就是从客户业务和IT需求出发,合理运用数据中心标准,多维度平衡决策,从IT系统定位决定数据中心等级、建筑空间、信息路由、可用性、弹性、容量需求与投资等,使其达到综合最佳。空间、电力、冷却三个要素从不同方面限制了数据中心的规划方案,三者相互独立却又互相制约。在一个数据中心供电最大容量确定的情况下,就可以根据典型数据中心的特征,或者PUE等得出数据中心IT设备的最大用电量、功率密度、冷却容量和建筑面积。反之亦然,冷却容量影响数据中心气流组织形式、建筑层高、机柜的发热密度等。
数据中心客户经常面临这些问题:
  • 供电系统脆弱,电力容量不够;
  • 空调冷量不足,气流组织不合理;
  • 结构荷载不合规,满足不了承重;
  • 机柜数量无计划增长;
  • 系统容量难以匹配业务发展等。
这些问题的出现,使得数据中心容量规划十分有必要。

3

容量规划

数据中心容量规划的目标是确保始终有足够的电力和冷却容量来支持IT机柜。为了确保能够提供充足的容量,在规划阶段时必须涵盖数据中心全生命周期内的最大预测负载。数据中心容量规划包括空间、电力、冷却、网络等几方面。相比之下,网络多不参与容量规划解耦。在选址时,尽量靠近中国互联网骨干网络节点,减少网络传输延时,就可以解决网络问题。下面对空间、电力与冷却三个方面做出充分探讨。
3.1空间规划
通过前期对主要业务访谈和对机房现状进行考察,利用SPC工具对业务增长做出预测分析,推理主机房面积需求,考虑数据中心机房布局、空间规划,并考虑灵活性与运维空间。空间规划不可能一步到位,构建可以支持最大预测负载的基础设施,这可能会极其浪费,导致过度建设和容量得不到有效利用,造成不必要的浪费。基础设施建筑标准化、机房模块化部署就能较好解决此问题。
数据中心的Tier等级决定了数据中心的冗余要求和路由分配路径,首先根据业务需求确定数据中心等级和功率密度。数据中心的空间需求是由机柜的数量决定的。机柜有多种尺寸,估测数据中心所需空间,首先需了解机柜的尺寸和数量,IT机柜尺寸多为600*1200或600*1100mm。
数据中心层高由架空地板高度、机柜高度、走线空间、回风空间、结构梁高等组成,(如图1所示),数据中心机房层高约5.5m~6.2m。管网式气体灭火,一个防护区容积不宜大于3600m³,单个机房模块多小于600㎡,对于功率6kW以下的机柜,冷通道可以设置两块地板宽度1.2m,每块地板送风量大约1296m³/h,每块地板服务相应的机柜,热通道宽度多大于冷通道宽度,结合柱网跨度确定热通道宽度,进而行级模块快速复制(如图2所示),一个机房模块大约容纳不超过250个标准机柜,完成机房模块化和建筑标准化。
图1  数据中心层高分析
图2  行级模块化
对于更大功率的机柜,就需增加冷通道宽度或者设置列间空调等措施,机柜数量就会减少。平面规划就是用70%或者更小的支持区、辅助区面积来服务30%及以上的主机房区,进而可以推算总的数据中心面积。数据中心等级不同,架构不同,所需支持区、辅助区的空间面积就不同,综合建筑面积折算下来,对于Tier III,约每6~8㎡一个机柜,对于Tier IV,约每8~10㎡一个机柜。由于防水防洪的原因,数据中心站房平时不设置地下室,首层多为10kV变配电室、冷冻站等机电用房,根据容积率与建筑密度的限制,可以做成若干个标准化建筑模块。
建筑模块化设计,机房模块化启用,分楼层、分模块逐步实施,空间规划的具体实现与数据中心建筑设计、各功能区合理布局紧密联系,这样,数据中心才能具备高可靠性,实现在线维护,具备高安全性和扩展灵活性。
3.2电力规划
数据中心电力规划,就是根据业务需求合理选择数据中心的保障等级和系统架构,合理进行电力规划及备用电源设计,这是数据中心重中之重的关键。供电范围包括关键IT设备供电、冷却系统供电,供电设备损耗、电池充电、照明、楼控及安防等。要规划数据中心电力需求,就需要了解关键IT设备、冷却系统等所需电量。首先应按机柜部署计划,统计各类机柜的平均功率,计算总的机柜用电容量。
冷却系统的用电容量视冷却系统类型不同,相差较大。假设关键IT设备功率为1,采用风冷冷水机组的冷却系统,折合冷冻水泵、风冷冷凝器等功耗,系统综合COP大约为2.4,冷却容量取1.3,其供电容量约为0.54,新风系统与机房精密空调风机大约供电容量0.15,考虑电梯、照明、给排水等供电容量大约0.1,数据中心总供电量约1.8左右;
采用水冷冷水机组的冷却系统,折合冷冻水泵、冷却水泵、冷却塔功耗等,系统综合COP大约为4.5,冷却容量取1.3,其供电容量约为0.3,新风系统与机房精密空调风机大约供电容量0.15,考虑电梯、照明、给排水等供电容量大约0.1,数据中心总供电量约1.6左右。变压器的长期工作负载率不宜大于85%,并乘以一定的安全系数,用于补偿功率因数及可能的峰值功率,确定数据中心总的电力规划容量(kVA)。
交流输入配置两路电源—主供电电网和完全独立的备用电网或柴油发电机,且配电线路也需冗余。在主供电网络故障时,柴油发电机组有10s~15s的起动时间,转换开关也有百毫秒级的转换时间,在后备UPS支撑下,不会对关键负载产生影响。UPS系统是完全独立的2N冗余系统,两个系统中的所有设备包括输入转换开关都相互隔离和冗余。UPS输出配电通过两条相互隔离和冗余的线路向双输入负载供电。
在设置蓄电池时,按照15min备用放电时间进行配置。在规划阶段中需考虑设备通道和操作空间,故障发生时,故障设备不能顺利搬出或者操作空间不够等,导致故障时限增加,甚至引起更大事故;尽可能做到自动检测和隔离故障运行,减少运维人员手动操作环节,减少因手动操作导致的不确定性和不可控性。
图3   数据中心配电架构
对于较大规模的数据中心,为满足数据中心重要负荷用电的可靠性要求,应急柴油发电机组多采用10kV高压发电机组,根据容量可采用多组并机运行,每组按(N 1)模式并机运行。柴油发电机组设置地埋式油罐,储油容量需满足12小时运行所需容积。
3.3冷却规划
气候条件对于数据中心具有十分重要的意义,根据气候条件选择最合适的冷却措施,比如间接蒸发冷却、水侧自然冷却等,这些可以实现更低的PUE目标。一般情况下,在规划阶段可以进行冷却容量估算,IT设备功率可按100%转化为热量纳入冷却负荷,计入变压器损耗,UPS损耗散热按5%~7%纳入冷却负荷,冷冻水循环泵以及末端风机散热纳入冷却负荷,再加上围护结构传热及人员、照明引起的负荷,考虑极端温度情况,数据中心总的冷却容量约是IT功率的1.3倍左右。
保持正压的新风系统所需冷冻水温度与数据中心不同,多采用独立的冷源。数据中心的所有热量需冷却系统带走,按冷凝方式的设置情况冷却分为风冷和水冷,风冷对自来水的需求无特殊要求;水冷冷却方式,每天每kW机柜耗水量大约100L,一个一万㎡的数据中心,设置1000台6kW的机柜,每天的耗水量就接近600m³,水量需求是惊人的,应充分重视水资源利用。为应对市政断水,需要从不同道路上引入两路水源,设置两座独立的冷却水补水池,保障12h的冷却水补水量需求。
针对功率密度和设计等级,一般4kW机柜功率密度以上、国标A级、Tier IV等数据中心就需要设置连续性制冷,蓄冷罐作为市政断电情况下的应急冷源,机房空调末端风机、控制系统、末端冷冻水泵需UPS供电。蓄冷容量按照15min考虑,保证市电断电后,柴油发电机组启动、并机、逐级供电至冷水机组供冷正常这一时间段的连续性制冷,使冷却连续性与电力连续性保持备用时间一致。
冷却系统的架构与设计等级直接相关,Tier III数据中心,设置N 1系统架构;在Tier IV数据中心,虽然2N架构不是必须,但往往2N架构是Tier IV数据中心的经常选择,这就需要将竖向路由与水平路由做详细规划,两个系统进行严格的物理分隔,包括冷源侧、输配侧、末端侧等,其中一个系统出问题,另一个系统仍能保证数据中心正常运行,满足容错要求。
冷却系统是影响数据中心PUE值的关键因素,根据气候条件可选择合理的冷源形式,缺水地区可规划带自然冷却功能的风冷冷水机组,其冷却系统的年均PUE值在0.35~0.45左右,视所在地点的干球温度而定。不缺水地区可规划水冷冷水机组,冬季利用冷却塔作为冷源,进行水侧自然冷却,其冷却系统的年均PUE值在0.25~0.35左右,与数据中心所在地区的湿球温度时频分布有关。
近年来,在数据中心PUE趋于严格的形势下,间接蒸发冷却技术(如图4)引起大家的重视,一方面可以节省大量水资源,另一方面利用较小的逼近度,增加自然冷却的供冷时限,其冷却系统的年均PUE值在0.2~0.3左右,尤其适合于我国西北地区。尽量选择单台冷量足够大、体积足够小的间接蒸发冷却机组,少挤占主机房面积,不影响数据中心高度,冬季的结露结冰问题也需要足够的关注。
图4   数据中心间接蒸发冷却装置

4

总结

对数据中心的空间、电力、冷却等容量规划进行了较详细的讨论,需要说明的是这仅仅是一种规划经验值,不适用于所有数据中心,随着高压直流、液冷等技术的大面积应用,一些数据需要修正,需具体项目具体分析。
规划阶段运维人员也需参与,充分了解和掌握维护系统的结构、薄弱环节、潜在风险,可以弥补设计人员对系统运行知识的欠缺,提高设计质量,避免设计缺陷,也有助于提高运维效率,制定后续切实可行的扩容计划。目前,越来越多的软件可以做到数据中心容量参数实时显示,可以快速查看使用容量及剩余容量,对数据中心容量规划提供充分保障,需要进一步总结经验数据,为数据中心的设计与全程管理提供参考与依据。

查阅 现代数据中心网 2020 系列文章

(0)

相关推荐