超大规模计算部署:项目实施与未来发展

作为超大规模云服务提供商,您可能正在考虑如何选择在全球市场上提供超大规模数据中心服务的合作伙伴。首先您需要在特定区域寻找超大规模计算伙伴,然后进入高度复杂的项目实施阶段。本指南将介绍这一流程的重要环节——从项目准备到实施,再到最终运营。它将帮助您了解各个阶段的最佳选择和最佳操作,确保您的投资获得最大收益。

ColtDCS

充分利用超大规模数据中心合作伙伴

企业迫切需要专有计算能力和长期扩展空间,往往需要建设涉及多方利益相关者的复杂大型项目

超大规模云服务提供商开始寻求传统托管模式无法提供的数据中心容量。企业需要在目标市场获得专有计算能力,还需要足够的长期扩展空间,往往需要建设大型复杂项目,这些项目涉及采购、设计、投标管理、施工和服务管理等领域的大量利益相关者。

由于在项目实施期间需要不断调整各类事项的优先级别,协调各方利益,使得项目管理困难重重。项目实施过程中发生的错误将在后续项目中进一步放大。

整个实施过程风险很高,因此您需要从一开始就开展密切合作:既要开展内部团队合作,也要与超大规模数据中心提供商合作。

根据多年积累的项目实施经验,Colt DCS柯尔特数据中心服务对项目实施过程中常见的陷阱和可用的优化机会了如指掌。如果您能够巧妙地利用机遇、避开陷阱,将有助于简化流程,在原有预算范围内根据自身需求顺利完成部署。

01

第一阶段 准备

超大规模计算项目事关重大。无论是增加现有站点的容量,还是与数据中心提供商开展合作,从头开始构建新数据中心,您的合作对象都不仅影响到客户的服务质量和竞争能力,还会影响您的品牌声誉。合同金额动辄以亿计,项目时长少则 5 年,多则 20 年,这些都意味着您务必慎重选择合作伙伴,以更好地满足业务、计算和技术需求。

您可能以为,选择合适的超大规模数据中心提供商就是在合适的地点找一家能够在规定时间内以适当价格提供服务的合作伙伴,但实际上远没有那么简单。

满足基本技术要求(包括机架空间和供电质量)只是超大规模数据中心提供商的最低要求。随着云服务提供商日益重视超大规模数据中心容量,数据中心提供商之间的竞争也出现了新的标准。这些标准包括:

灵活性

没有一家数据中心能够完美满足客户要求,因此提供商必须具备足够的扩展能力和适应客户需求的能力。

即使是已经完工的数据中心,提供商也要能根据您的要求改变温度水平或电池监控设置。在同一地点部署后备站点,也能提供重要的安全保障。如果您计划在本地市场进行未来扩展,提供商还应具有足够的本地容量来帮助您实现目标。

安全

您需要为所有数据中心建立通用标准,特别是施工安全标准。您还需要认真考察供应商的历史业绩,调查此前发生的施工现场事故。提供商员工是否了解施工过程,重视施工安全?如果有证据表明供应商曾偷工减料,您的品牌声誉很可能受到影响,员工也会面临安全威胁。

本地知识

您距离本国司法管辖区越远,项目复杂性就越高,风险也越大。如果您不够了解当地市场,那么项目规划、采购法律、设计和建造实践以及复杂的本地生态系统都可能让您头痛不已。供应商必须有能力承担这些风险和责任,因此您还有必要对供应商的本地市场经验进行评估和排序。

02

第二阶段实施     

选定超大规模数据中心合作伙伴后,即可启动项目实施。这个阶段包含多个环节,可能是整个超大规模计算部署中最耗时也是最复杂的部分。

签约

这个环节非常重要。双方将在这个阶段商定报告要求和服务水平协议(SLA), 并制定违约处罚措施,提供商必须明确告知其交付能力。另一方面,客户也应开宗明义,明确提出项目要求。在此阶段未达成共识的所有问题都将在后期阶段变得更加棘手。

设计

无论已有站点还是新建站点,都不应在项目竣工之前敲定任何设计规范。在整个项目过程中,客户需求和项目要求总会发生变化,因此双方应密切合作,确保站点从一开始就能交付价值。在这个过程中,应以开放的心态接纳变化和建议;优秀的设计团队应学会通盘考虑其他人忽视的问题,以提高项目效率。

还需要考虑站点自身所受的限制,寻找变通方法,保证在预算范围内按时完成项目。有时功率密度可能会超出原先的设计范围。提供商和客户可以考虑采用热通道气流遏制系统、补偿空间甚至行间制冷单元来解决这个问题。

还可能出现供客户使用的物理空间不足或机械工程(M&E)容量不足的问题,此时可以考虑更换或添加不间断电源(UPS)或远程控制单元(RCU)等组件。

团队合作非常重要

在这个过程中,应以开放的心态接纳变化和建议;优秀的设计团队应学会通盘考虑其他人忽视的问题,以提高项目效率。

施工

很多超大规模云服务提供商选择由签约合作伙伴为其建立数据中心。与自行施工相比,这种模式有助于提高设计定制级别,减少施工风险。

您很难在一个完全陌生的市场直接参与项目。不过,在新建项目的所有建设阶段,客户参与都具有重要意义。

项目延迟或出现时间问题时,合作双方可能会出现摩擦,此时可以请求客户延长项目计划来解决矛盾。罗马不是一天建成的,但施工方必须严格遵守延长后的项目计划。

调节与测试

从质量和安全的角度,调试阶段是整个项目周期中最重要的环节之一。必须对超大规模数据中心合作伙伴进行监督,确保其在整个调试过程中实施最标准的作业。查看所有现场设备的制造商说明书,确保提供商正确完成所有测试——从电池装载到放电时间,再到停电时使用的安全出口灯。

测试最终设备时,必须有经验丰富的调试人员在场。基础设施交付完毕并准备就绪后,应启动下一轮测试。

这一轮测试为压力测试,设备需要达到100%甚至更高的电力和冷却负荷,以测 试整个系统的承压能力。

俗话说得好,小心驶得万年船

必须严格遵守说明书的要求,对设备开展全面测试——从电池装载到放电时间,再到停电时使用的安全出口灯。

设备安装

一旦所有规划、筹备和施工阶段完成,作为客户的您就开启了实际安装阶段。这个阶段需要在新站点安装机架、铺设电缆、安装相关的机房基础设施,为提供云服务做好准备。在这个阶段,双方最好保持流程的开放性,以应对突发的意外变化或延迟。

分阶段实施可能是最适合您的模式。不必等待安装合同规定的所有容量安装就绪,完全可以在机房建设期内逐步启用已有的容量。这样您可以更快地进入目标市场,并在一段时间之后扩大规模。分阶段实施模式正在成为超大规模计算市场的标准方法。

不过,采用这种模式可能会使项目实施周期连绵不断,持续数年。首座机房可能只需要 6-9 个月即可投入使用,但全部容量投产却可能需要两三年之久。随着站点可用空间逐步增加,客户也可以实施进一步扩展。

项目的复杂程度会随着时间推移而增加,因此必须加大监督与合作力度,确保逐步顺利完成整个流程。必须在整个项目流程中保持顺畅交流,以便满足服务水平协议的要求。提供商应尽可能任命过渡经理,负责受理客户申请,简化项目流程。

03

第三阶段 运营

整个流程的每一个环节,都可以采取相关措施简化流程、降低成本、缩短交付时间和确保可靠性。

只要站点具备交付服务的条件,即使在项目实施期内也可以启动运营。实施阶段与运营阶段同时进行,因此有必要组建独立团队,分别负责项目和运营工作,以降低复杂性。

提供商的服务经理负责提供服务报告,受理客户的实时操作请求。应督促服务经理举行例行服务会议,审查运营情况,向您汇报预防性维护计划的所有变更。

与以往一样,定期审核和演练是确保提供商遵守服务水平协议、及时响应问题的关键。但要注意与提供商保持和谐关系。举行演习之前应及时通知,并与提供商商定演习实例的数量。

如数据中心市场发生安全事件,您应督促提供商迅速采取行动,检查站点的安全漏洞。

ColtDCS

结论:关系以信任为基础

您与合作伙伴的实施团队也许具备很高的专业素养,但仍需注意在项目流程的各个 阶段(从选择提供商到项目投入运营)采取必要措施降低成本、缩短交付时间、确保可靠性。

随着物联网(IoT)和互联建筑管理系统(BMS)的兴起,客户与提供商之间的壁垒已经消失。提供商掌握的有关数字中心的知识对于您也不再是秘密。

信息对等提高了工作效率和透明度,但您仍需尊重双方的边界,以便于提供商高效运营站点。关键在于选择值得信赖的超大规模数据中心合作伙伴,然后在接下来的数年里开展密切合作。

(0)

相关推荐