机房搬迁整体方案参考
【作者】yujin2010good
搬迁我是专业的,我在公司呆了将近7年,机房从自建机房搬到租用机房,微软云搬到AWS,AWS搬到青云,青云搬到腾讯云,现在又在继续老机房搬到亦庄新机房。
一、目标
机房搬迁整体方案是为了平稳迁移所有业务,在有限的资源和有限的切换时间(甚至秒钟级别时间内)完成搬迁(银行、ATM之类的公司不能比,在不提供新资源或者提供基础几台资源的情况下搬迁), 保证机房业务和数据能够安全、可靠、快速的搬迁。
二、 背景
现今IDC跟10年前IDC不同,第一是数量开始增多,第二是价格下降,第三是很多公司使用公有云替换了IDC,当然也有使用公有云 IDC的公司。总之现在因为需求的不同,各种方案都有。(使用公有云替换自己租IDC的公司,主要考虑自己维护管理机房、采购服务器、后期维保服务器等不是专业的,专业的事交给专业的公司干,将公司的精力集中到公司业务,当然关键的还能提升运维效率,如,一个项目立马上线,如果普通中小企业无备用服务器的情况下,就需要立即购买,可能会有选型、招标过程,这样整个采购周期就很长,项目上线可能延迟。如果使用云几分钟就完成任务)。
三、 迁移前的考虑
(其实这里搬迁到云上已经包含其中,当然有一些没法搬迁的后面补充)
1、 机房标准:环境了解,机柜位置了解,机房动环系统,pda插口是否满足需求。
2、 一般租用的机房公司,他们是否给巡检,是否有基本的上架,梳理线缆服务(实际工作中,上架、拉线、绑线很浪费时间,最后还不是很美观。)
3、 机房专线进入是否方便,进园区是否收费,机房所在公司是否在收端口费用,端口费用有多贵?
4、 网络如何规划,需要多少个接入交换机,路由器、防火墙,是否满足高可用,是使用大二层还是3层网络?是使用基于单个主机冗余(交换机浪费,但是适用于中小企业),还是基于整个机柜甚至整排机柜的冗余?我们曾经的机房是基于主机冗余(单台主机双网卡绑定),现在新机房是使用基于机柜冗余(允许宕机一个机柜)
如果是公有云:考虑网络规划、网段、安全组等基础环境配置,然后考虑专线跟IDC打通。
四、 搬迁团队(运维人员 开发 业务)
1、 是否雇佣专业搬迁公司,还是自己搬迁 雇佣车。原则上是重要设备、高端存储之类的设备雇佣专业公司进行搬迁,普通x86服务器,多节点的业务,自己搬迁即可。(可以节省很大的成本)
2、 一般情况下搬迁团队是由公司运维部门担任,当然一般搬迁都是公司大事,必须知会各个开发部门领导和产品,甚至开专门的动员会,这样开发才会配合支持。
五、 原机房注意事项
1、 统计搬迁的数据:机器数量、分别每个机器的u数,分类搬迁。
2、 准备打包箱子、标签纸、扎带等
3、 小型机链接线务必轻拔轻放,包装好。
4、 根据业务类型划分搬迁次序,分配到责任人,责任人务必包含运维、开发、产品。比如:支付系统、营销等
5、 识别特殊系统,比如:有停机先后顺序的,带存储的,挂载有nfs的系统,带狗的系统,有物理机授权等。
六、 针对每套系统具体方案编写
1、 按照具体业务列出具体系统中的每个模块,如营销系统中的优惠券、活动,采销系统中的订单、主数据等,越细越好。
2、 按照每套系统的每个模块编写文档,内容包含原主机ip、部署内容、部署路径或者目录、缓存ip、数据库连接ip,zk地址等等,所有详细信息均要列出。
3、 与开发沟通编写api部分模块,具体到调用接口和http接口,所有接口都要列出(后期用于验证)
4、 网络层面权限查看,是否有特殊限制,比如分支机构或者分公司是否有权限访问。
5、 域名查看,是否有公网。
6、 注意点:如tomcat是否有用户限制,最好方式是将tomcat直接打包原路径解压。即使是平台管理也可以这样操作。
7、 数据库连接查看,是否有共用库的情况,是否有大数据抽数,是否有其他特殊权限。
七、 具体切换方案
1、 网关或者负载均衡按照原配置配置即可,后面切换dns即可。
2、 Web层大部分系统为基于互联网的多web或者多模块系统,1:1部署即可,按照第六步统计结果进行部署即可。
3、 Redis、mysql、mongodb采用数据同步
4、 Es采用加入集群同步数据方式,完成后把老机器踢出集群。
5、 如果有Oracle,采用OGG或者DG同步到新机房,提前配置应用JDBC链接,当数据追平时,重启应用即可生效。这步说来简单,实际办起来可能因为数据大小,或者每天产生的数据过多,会导致性能问题。当然还有一些其他的问题,细节上要注意,多想问题。
6、 最难的就是一些老系统,比如一些win系统,开发走了无人维护,甚至一些系统是购买的商业软件,但是这个商业软件公司已经倒闭。这种系统最麻烦,一般采用硬搬,当然要备份相应的数据。
7、 小型机和存储搬迁也是麻烦事,注意上面拆除小型机,一些连接线要保存好,存储这个该买保险买保险。
八、 具体切换
1、 按照上面7个步骤该准备的准备,越细越好。
2、 提前将新环境部署好,只等待dba同步数据,等到数据同步完毕,每套系统按照具体的修改代码提交,发布,链接到新机房的库。
3、 数据库检查链接正常,即可验证业务。
4、 产品通知业务一起验证业务。
5、 回顾切换过程中的问题,形成总结文档。
九、 总结
以上几点均是我在搬迁工作中形成的一些经验,越细越不容易出问题,一般迁移切换选择闲时进行,比如晚上或者半夜迁移切换,往往第二天早上因为一个配置疏忽造成业务受影响,所以重要系统,重要配置最好双人检核,避免出现事故。
迁移这个活对公司内部成员来说不是功劳苦劳,是应该干好的,不出现问题是应该的,出现问题就要追责。一入运维深似海,万年填坑填不平。
原题:机房搬迁整体方案 如有任何问题,可点击文末阅读原文,到社区原文下评论交流 觉得本文有用,请转发、点赞或点击“在看”,让更多同行看到
扩展阅读:
机房迁移细则规范 & 机房搬迁实施规划方案 | 实用资料
机房迁移细则规范
机房整体迁移是弱电布线项目中的一个重要环节, 为保证机房设备能够安全、可靠、快速的搬迁 ,特制定以下工作步骤、注意事项及需求。
一、 现场了解客户需求,包括以下事项
1、甲方搬迁的目的地,包括了解起始地和目的地所在大厦的运输路径及货梯运行时间。
2、搬迁的设备都有哪些,是否需要专业人员配合。
二、 绘制搬迁前的机房布局图
1、 绘制完整的设备链路图。
三、 IT设备接线(网络及外设)
1、特殊接口设备连接线做接口连接线记录,粘贴标签。
2、服务器连接线路做标记,尤其是和磁盘柜串口连接的线路,粘贴标签。
四、 制作标签及贴标签
1、如有磁盘柜和可插拔磁盘都需要拔下来粘贴上标签并单独打包放好。
五、 机房停机操作的顺序
1、 待一切就绪后,由甲方将IT设备停机断电。
六、 IT设备的卸柜
1、所有连接线跟随原设备打包入箱。
2、所有卸下来的设备必须单独打包做标记(包括螺丝, 轨道)。
七、设备的装箱
1、卸下来的所有IT设备必须用泡沫布包装。
2轻拿轻放,打包好以后在箱子外面写上同设备标签一样的标示。
3所有打包设备必须有一人来清点记录。
八、IT设备的搬运
1、搬运时每次跟随一名工程师,以保设备在搬运过程中不会发生设备滑落。
九、IT设备的装车及运输
1、所有设备搬运到目的地以后清点对应记录。
十、线路连接(包括设备电源线)
1、所有设备安装好以后,检查连接线是否连接原有端口。2:确认电源线已连接好,数据线路没有因为理线造成松动或脱落。
十一、IT设备 加电系统核查
1、确认所有IT设备连接线正确,并保证设备的电源连接线已插牢。
2、由对方IT来启动所有IT设备。
十二、测试、验收
一:机房配电到位、机房接地
二:承重问题
三:设备进机房之前先做保洁、并且门要到位
四:外线进入需和大厦物业洽谈端口占用费
五:建议有备用硬盘
六:希望提供新机房机柜设备位置图
机房搬迁实施规划方案
一、概述
机房的搬迁,一般都会涉及到服务器、交换机、路由器等大量的设备,很多软件的问题,以及新IP的分配问题等。因而如果不提前进行详细的规划,匆匆上马进行机房服务器等设备的搬迁,势必会造成工作的混乱。所以在搬迁前,一个完整合理的机房搬迁规划是必需的。
二、托管机房现状
2.1 机房现网络拓扑图(略)
2.2 机房现机柜图(略)
2.3 描述
由于3台VMware虚拟化服务器和一台存储的物理位置占用市级平台机柜,收费服务器外网出口为市级平台外网出口,防止市级平台服务器机柜有突然变动,或我方服务器需要搬迁,建议将VMware虚拟化服务器集群搬迁至我方机柜中,其中物理地址不需要做任何改动;收费服务器外网出口变为我方公网地址,其中物理位置不需要进行改变。
三、托管机房搬迁后情况
3.1 搬迁后拓扑图(略)
3.2 搬迁后机柜图(略)
3.3 描述
将VMware虚拟化平台集群并入到我方机柜中,收费服务器外网出口(含电信专线)并入到深信服防火墙中。其中VMware机群物理地址沿用原地址,收费服务器在深信服防火墙中新建现用内网地址,将外网出口地址变更为我方外网地址。网络设备放置于机柜后端合理部位。
四、搬迁前准备工作
4.1 系统的检测及备份
在搬迁以前,我们要针对现有的服务器设备进行一次全面的检测工作,包括:硬件的配置的检测和软件信息的检测。准备工作要做的充分,这是保证搬迁工作能够顺利进行的首要条件。通过检测我们不仅可以有效地把一部分隐患排除在搬迁之前,确保在搬迁过程中,机器设备的故障率降到最低,从而避免在搬迁工程中的计划外宕机时间。
4.2 硬件设备的检测
针对服务器的硬件设备,我们将详细的记录服务器的硬件配置信息,在搬迁以前明确硬件配置,具有针对性地准备一些备件,在服务器菪机的时候能够及时的修复服务器,及时的解决由于硬件故障产生的计划外菪机,避免不必要的宕机时间。
4.3 服务器软件应用的检测
针对服务器的软件应用,我们同样也要进行一些常规的检测,把一些由于软件问题产生宕机时间减少到最低限度。从而使搬迁工作能够顺利进行。
4.4 数据的备份
数据的安全性在每个企业中都是至关重要,数据的丢失,不是以金钱来衡量的,所以数据备份在搬迁过程中显得尤为重要,即使在搬迁过程中,真正遇到服务器系统问题时,我们也能够在最短的时间内解决问题,减少计划外的宕机时间。确保搬迁工作的顺利进行这里数据的备份,包括所有关键数据,如:操作系统、应用程序、数据库、服务器的配置参数、网络设备的配置参数等。
4.5 对设备进行分类统计
目前我们的托管机房设在二层,其中的设备包括交换机、服务器、防火墙、存储设备等,由于我们搬迁服务器和存储设备,我们对于机房目前涉及的设备统计表如下:
原有存储设备、服务器确认,确定服务器的数量,服务器的型号等,并且在搬动服务器之前必须有详细的表格记录。同时对SAN网络涉及的阵列、交换机也做一个详细的记录。
服务器及存储等设备统计表
服务器名称 服务器1端口 服务器2端口 服务器3端口 服务器4端口
SAN交换机端口对照表
服务器HBA 服务器1FC1 服务器1FC2 服务器2FC1 服务器2FC2 服务器3FC1 服务器3FC2
光纤交换机端口
五、各类设备的搬迁
服务器是网络数据的核心。对于服务器这种集成度和精密度都非常高的计算机设备,我们在进行安装和卸载部件操作时,一定要格外小心。
5.1 搬迁时需要注意
正确关闭电源
对于一台已经配置好的服务器来说,它的关闭和打开操作很简单,但如果操作方法不当,有可能对设备造成不必要的损坏。因此,有必要对服务器的开机、关机做一详细介绍。
关机操作:1.关闭操作系统;2.关闭主机电源;3.关闭外设电源 (如磁盘阵列,磁带库等);4.关闭其他设备电源和机柜电源;5.关闭总电源。
开机操作:1.打开总电源;2.打开计算机机柜电源;3.打开外部设备电源(如磁盘阵列,磁带库等);4.待外部设备自检完成后,最后打开主机电源。
5.2 搬迁设备标签
我们的目标是:掌握原有的网络情况,力求要做到每一条物理,逻辑的线缆,专线都心中有数,所有网络设备的配置,每个接口都要一清二楚,所有设备,线缆都要贴标签,所有接口的配置,说明都要有文字上的说明。在给设备做标签时,一般是采用贴设备铭牌的方式,线缆采用专用的标识环。
最后,对设备标识完成后,注意做好标识的备份工作,以备设备重装时核查。
所有标示,做到一一对应,保证在搬迁过程中能够准确的找到某一台机器设备,保证搬迁的顺利进行。
六、设备重新安装
6.1、物理安装
设备搬运到新的机柜后,首先确定设备的放置位置,检查电源等相关事宜是否做好,最后,进行物理连接。
这里需要注意:
区域规划。在设备安装时,最好按网络拓扑结构进行区域的规划,并为以后的扩展保留空间和相关接口。
工程师按照安装方案,根据安装方案把服务器上机架。严格遵守规范化操作,把服务器安装到指定位置。
(1)安装导轨:安装工程师把服务器的导轨安装到机柜上的指定位置,以便服务器上机柜。
(2)安装服务器:安装工程师把服务器安装到机柜上的指定位置。
(3)安装电源线:用电源线把服务器于PDU连接,把电源线捆绑在配线架上。
(4)安装SWICH:把SWICH固定在机柜上的指定位置。
(5)连接数据线:连接SWICH到服务器,连接网络线。
6.2、设备加电系统核查
设备物理连接完成后,为设备加电,测试电源电压,进行加电后系统的软硬件检查。
七、测试
设备重新安装后,我们接下来要做的工作是:打开设备,查看数据是否损坏,并进行相关的软件设置。一般来说,要进行的工作大致包括如下的几项:
(1)服务器状态的恢复,查看是否出现了数据的丢失或损坏。这里由于我们之前对系统数据作了备份,所以,一旦出现了这种数据的损坏等,我们应该把搬迁前的数据重新恢复过来。
(2)进行全网设备连通型的测试
(3)进行应用测试,确保系统的正常运行。包括2个方面:
市级平台的验证,确保在搬迁设备时候,没有拔错线和碰到市级平台的线路
搬迁后的应用测试,确认网络配置没有问题。
(4)所有的设备重新启动,看设备运行的速度和质量等指标是否达到标准。
(5)验收并进行相关的日志记录。
(本文由liwanqiu2232分享)