重磅升级,全新出发
近日,腾讯数据中心服务台在总部深圳全新升级投产,该平台是目前国内最大规模的数据中心集中化运营服务平台,支撑腾讯全球100+数据中心及百万级IT设备的运营服务工作;标志着腾讯数据中心正在加速向集中化、平台化、智能化运营方向升级和发展。
腾讯数据中心服务台综合服务大厅
当前,腾讯云在全球数十个国家和地区建立起100+中大型数据中心,支撑百万级IT设备的运营管理。数据中心体量大、分布广、运营管理方式多样化等特点,给打造腾讯云数据中心全球统一标准服务带来了巨大的挑战。
早在2018年,腾讯数据中心服务台(ISC)应运而生。从数据中心基础设施集中化监控开始,不断拓展运营和服务方向;建立了IDC集中化运营、IT综合服务支持及腾讯IDC云服务门户三个板块;作为腾讯数据中心运营的中台,依托腾讯智维(Tnebula)掌握实时的运营数据,实现对全球各大数据中心的集中化运营和服务。
在处理海量IDC运营数据的同时,基于最佳实践不断对平台进行优化和持续改进。随着平台版本的迭代,平台可用性、可靠性的不断提升,腾讯数据中心运营管理,实现了从量变到质变的升华——由传统的属地化管理向平台化、集中化、智能化发展。
腾讯数据中心服务台服务架构
基于主动监控的
数据中心集中化运营
通过三年的发展,腾讯数据中心服务台(ISC)基本实现了对国内各数据中心的设施监控接入。从初期的以接入动环厂商数据为主(智维1.0),到目前接入自研的本地智维数据为主(大园区智维2.0),一步步解决了DCIM平台的监控有效性和平台可靠性问题,推动智维平台的实用化,为后续的自动化及智能化运营打下坚实基础。
01
可靠的设施集中监控
告警质量决定了监控的实用性,经过长期运营、改进及提升,将经验和标准固化在智维2.0平台,平台实用化方面有了质的提升。
2021年服务台日均处理告警超过1万条,经过告警收敛后,通过事件单形式派发给各地数据中心进行检查、校验处理、反馈和总结,形成闭环持续迭代改进。
02
实时的风险管控,打造运营的最后一道防线
设施系统的割接、操作及变更历来是数据中心运营高风险时段,通过对变更告警的隔离式监控、操作过程关键点check、异常监控的及时发现和第一时间启动应急响应,担负起“吹哨人”的职责,有效的降低了设施变更的风险。
7*24主动监控运营
03
基础设施+IT集中运营融合
服务台打通了数据中心基础设施集中监控与服务器及网络设备的集中监控。通过智维平台实现IT设备的电力、温度、设备运行状态与设施监控告警的联动和展现,两者监控信息相互比对和校验,在提升告警准确性的同时,可快速实现业务影响评估,也为后续IT与设施运营联动奠定基础。
基础设施+IT监控的融合策略
此外,针对地震、台风等自然灾害,新冠疫情等公共卫生事件,重大节日业务保障等,腾讯数据中心服务台发挥平台化运营的优势,联动腾讯全网各地数据中心,启动相关流程和预案,为海量业务运营保驾护航。
统筹IDC服务站运营
7*24全方位服务支持
腾讯数据中心各园区现场部署着数千人的设施、IT运维团队,服务台统一负责对所有运维团队的技术能力进行培训、对管理策略变化进行传达宣贯,保障现场运维人员对设备的抢修、维护、维保能力。
服务器运维技术支持
同时服务台作为腾讯数据中心运维支持和调度中心,为腾讯全球一线服务站工程师、驻场工程师和业务运维同事提供故障处理、工单监控跟踪、技术支持等7*24综合运营服务。
客户服务统一入口
7*24全栈售后支持
随着数据中心和服务器自研产品的逐步成熟,腾讯智维、miniTB、TMDC、T-Block以及星星海系列服务器等产品均实现对客户的交付,腾讯数据中心服务台作为面向客户服务的统一窗口,提供咨询、报修、技术支持、需求响应等服务支持的工作。
为满足客户的服务请求,腾讯数据中心官网提供统一服务入口——而服务台正是该服务入口的支撑团队,通过集中调度全球数百个运维服务站的资源,从而实现快速响应满足客户需求。
腾讯数据中心官网https://tidc.tencent.com
随着我国数字经济的飞速发展,腾讯近年在华南、华东、华北、西南布局了超大规模数据中心集群,部署腾讯第四代数据中心Tblock。在新的格局下,构建了三级运营架构体系——总部级ISC+城市级ECC+楼宇级LMC,并将致力于深化基于超大规模数据中心集群的设备生命周期管理、能效管理、产品质量管理、数据中心架构优化等课题。
腾讯数据中心集群布局
20余年来,腾讯数据中心始终致力于先进的数据中心技术、运营管理的探索与追求。腾讯数据中心服务台,凝聚了腾讯IDCer二十余年的厚积薄发。随着腾讯数据中心服务台的全新升级,我们将开启下一个海量数据中心运营管理的新征程。