智能IT运维系统如何运作?山东大学的实践案例告诉你!

随着大数据、物联网、互联网+、移动互联等信息化应用不断深入,信息化与山东大学的教育教学和科研、管理、生活已经深度融合,成为了学校发展的重要支撑。为了解决传统校园网在网络部署、运维和管理等方面长期存在的诸多问题,山东大学青岛校区校园网建设采用SDN架构,在控制区部署SDN控制器、认证系统及DHCP等,核心设备全部为100G骨干网,汇聚和接入设备1500多台,无线设备6700多台,满足业务高性能需求,智能化终端接入数量约10000多个。

随着学校基础设施建设日趋完善,如何高效的运维和管理这部分设施和应用成为了学校信息中心新的挑战。

基础设施品牌众多、种类复杂,通过传统的人工管理方式,不仅效率低下,而且被动式的运维体系,无法优先于用户发现潜在的问题;随着接入网络的终端日趋增加,对于终端和IP地址的管理变得更加复杂和困难,无法及时追溯终端的位置信息和IP地址的分配情况;用户的上网日志存在着大量的数据价值,有利于管理员进行定位溯源,如果仅仅将日志分散于网络设备中,将失去数据的价值。

随着山东大学青岛校区信息化建设的深入推进,学校工作对校园网络的依赖性越来越强,对网络的稳定性和可靠性也提出了更高的要求。完善的IT运维管理体系能够保障网络基础设施的稳定和高效运行,能够改善业务的可用性及可靠性。鉴于此目的,山东大学青岛校区构建了一套以基础设施数据为基准,多方运维数据联动的新型IT运维管理体系,有效提升了整体运维效率,实现了管理可视化、数据多样化和效益最大化。

智能IT运维管理系统

目前青岛校区核心网络已率先实现了100G互联,楼宇上联核心全部支持扩展到40G/100G,楼宇接入全部通过万兆上联汇聚,有线网络终端全部实现千兆接入;无线网络使用超过6700台最新的802.11acwave2无线AP,实现校区Wi-Fi全覆盖。

为有效监控青岛校区这张有线无线融合网络,避免在多套运维系统之间来回切换,贯彻一个平台原则,在青岛校区部署了一套智能IT运维管理系统。系统可自动对现网中运行的交换机、路由器、安全设备、无线控制器、无线AP实时全面的监控。在统一的平台上实现全方位的资源监控,通过数据收集和处理进行集中展现,实现性能数据、告警数据并行输出,并通过3D动态建模,实现资源动态可视化管理,构建IT运维人员全新运维视图。

智能运维系统可自动计算有线及无线网络设备之间的连接关系,以层级拓扑方式清晰展现整体学校网络结构。拓扑图中(如图1)以不同颜色直观展示设备及链路健康状态,并支持展示链路流量信息、动态实时更新,帮助运维人员掌控全局网络运行状况。

图1 学校网络结构中的设备及链路健康状态

以业务系统健康度为导向的监控体系

在学校信息化建设过程中,业务系统建设的运行状况直接体现信息部门的服务水平。如果业务系统出现故障,将导致全校师生无法进行正常教学和学习。因此对于业务系统的监控,青岛校区采用了CFIA理论树形逻辑关联算法为核心的监控体系,以应用系统为核心,结合该应用系统关联的网络设备、服务器、数据库、中间件等故障信息,进行联动计算,计算出业务的健康值,并且以业务拓扑方式直观呈现,清晰展现各层IT资源的结构脉络,当业务出现异常时,可从故障点自上而下的溯源分析,实现事前预警、事中感知、事后追溯。

数据联动实现终端上网全轨迹追溯

随着学校接入网络终端激增,需要采用更加智能的方式来管理网络和终端。青岛校区通过集成的核心服务、工作流和自动化,关联网络设备的接口数据、网络设备的机柜位置数据、配线架信息数据、房间墙插数据、无线AP的位置数据以及上网终端数据,构成有线无线终端上网轨迹链,支持网络设备、用户终端和IP地址之间关系的深刻洞察,提高安全性,确保终端始终可追溯性。

移动运维颠覆传统"座椅式"模式

随着移动互联网迅猛发展,利用移动互联网技术提升学校的运维服务和效率,无疑是一项新的尝试。青岛校区构建了一套基于智能运维管理平台开发实现的移动端智能运维系统,通过在移动端,可以随时随地接受来自运维管理平台的告警产生信息和告警恢复信息,并且可以联动运维流程进行移动化处理,例如提交服务请求、故障申报及流程审批处理,真正实现了运维的移动化,不必再受位置和空间的限制。

"账号+终端+IP+端口"数据链

运维管理范围不仅只管网络设备,用户的上网信息数据同样重要。青岛校区构建了一套以用户账号信息为基准,覆盖用户终端信息,NAT数据的全日志记录,将网络行为数据与用户标签数据关联,建立完整的用户网络行为数据模型,组成最直接简洁的数据链:谁(账号)在哪里(位置)用什么(终端设备)干了什么(在网络中做了什么);将传统的以IP为标识的行为数据变为以账号和终端为标识,溯源更精准。

在进行运维日志系统建设过程中,青岛校区网络运维人员探索了一条新的思路,可以基于用户的行为数据进行分析,例如可根据用户身份(如本科生、研究生、教职工)分析他们的访问行为,同时从时间以及院系、年级等标签维度进行分析,了解不同群体的行为特点,从而更有针对性的提供IT运维服务。又例如可根据网站域名统计用户访问量,获知哪些内部发布资源的访问量最高,并基于此及时调整资源带宽分配策略以及资源服务器数量;同时可统计校内学生访问哪些网站最多,获知学生的日常动态。

构建三地一体化运维体系

图2 智能IT运维体系

山东大学青岛校区智能IT运维体系(如图2)是应用大数据、智慧运维、移动运维等新IT解决方案在运维工作中的成功实践,运用新型IT技术解决教育教学中的实际需求,将在未来教育行业形成常态。同时山东大学青岛校区将继续探索新的技术路线,努力打造三地一体化运维体系,构建"集中化、一体化、智能化"的设计模式,分层设计,实现功能总集成、流量总调度、资源全监控,提升三地协同运维的能力。

(作者单位为山东大学信息化工作办公室)

(来源:《中国教育网络》2019年5月刊)

(0)

相关推荐

  • 融合千年传统技艺与现代科技,刀剪行业的智能工厂

    磨刀霍霍 无论是庖丁解牛的厨刀.精细到微米的手术刀,还是锋利易用的剪刀--这些功能多样的刀具,背后蕴含的是历经千年铸就的传统工艺.而随着CNC.物联网等技术的应用,一把把看似平常的刀,又在人类智慧的火 ...

  • 设备智能维保:企业生产过程中的问题及解决方案

    在企业生产过程中,一些企业仍采用传统的线下设备报修方式,一方面生产线操作工生产效率降低,另一方面企业无法及时满足生产任务,影响企业生产效益.那么这些企业具体的问题都有哪些呢? 1.管理模式繁杂 企业内 ...

  • 战略研究丨人工智能 制造业新模式与新业态

    本文选自<中国工程科学>2018年第4期 作者:"新一代人工智能引领下的制造业新模式新业态研究"课题组 来源:新一代人工智能引领下的制造业新模式与新业态研究[J].中国 ...

  • 基于增强现实技术的变电站巡检管理系统研究与应用

    会议通知|EITRT 2019 参会注册 长按识别左侧二维码,登录报名网站(先注册网站会员,然后提交报名信息) 会议微信号 摘要 国网山东省电力公司济宁供电公司的研究人员孙鹏.宋坤.徐刚.丁扬.张广飞 ...

  • ETC门架监测与运维管理探讨

    作者:靳冰,庄宁超(河南东方世纪交通科技股份有限公司) 摘要:在数字交通与取消全国高速公路省界收费站的大背景下,ETC门架监测与运维管理面临着前所未有的挑战与机遇.本文分析了运维业务存在的问题与取消省 ...

  • 城市轨道交通车辆智能运维系统

    (来源:金色轨迹) 1.引言 城市轨道交通对城市发展起着重要的带动作用,而城市发展对城市轨道交通安全可靠.高效集约.网络化.智能化的发展也提出了越来越高的要求.如何在保障城市轨道交通系统安全可靠运营的 ...

  • 干货分享 ▏上海地铁车辆智能运维系统

    目前,上海地铁运营里程数达705公里,位居世界第一.根据规划,至2040年,上海将建成总里程1000多公里的轨道交通网络. 面对日臻庞大的路网,依靠传统的人力.物力叠加式投入,很难处理好安全与效率之间 ...

  • 呼和浩特地铁基于云平台的车辆智能运维系统

    呼和浩特地铁1.2号线开通以来,基于车辆智能运维系统运行稳定,经过运营使用后能够很好的指导和辅助维修工作.在国内首次实现了全列车系统智能运维显示.云客户端智能运维WEB应用.子系统智能故障预警.运维数 ...

  • 上海轨道交通车辆智能运维系统

    (来源:中国城市轨道交通协会) 车辆智能运维系统建设目标 建设背景 上海地铁由于其超常规模和体量,同时建设时序长(新线不断开通,老线已进入大量更新.改造)以及长期的高负荷运行,必然对车辆运维产生极大的 ...

  • 福建首家可移动式低压配电网智能运维系统投用

    近日,经过两个月的创新试点实践,福建石狮市供电公司在福建省内首家投用基于边缘计算的可移动式低压配电网智能运维系统,有效提升了低压配电运维工作的智能化水平.该系统不仅是一套系统,而且是可移动的智能运维工 ...

  • 智能配电运维,数据中心的时代变革

    随着云计算.大数据.人工智能领域的快速发展,数据中心行业也进入了快速发展的阶段,而数据中心也正朝着大型化.高密度.绿色环保.模块化方向演变.为适应数据中心行业的迅猛发展,满足数据中心高效运营的需求,对 ...

  • 有一套完整的配电运维系统是怎么体验?

    有一套完整的配电运维系统是怎么体验?

  • 配电运维系统常见发生情况原因有哪些?

    近年来,随着我国用电量及新增配电室逐年增加,潜估的电力事故安全隐患呈现上升趋势,直接威胁着人民生命和财产安全,从我国历年的统计来看,无论是发生次数,还是直接经济损失,电力事故都是不容忽视的一部分.而通 ...

  • 写字楼人力坪效低、应急慢、高耗能,智能配电运维教你怎么破防!

    配电运行及能源管理在写字楼物业管理中占据极为重要的位置,一方面其涉及到楼宇配用电的安全可靠性,另一方面用电支出约占物业管理成本的30%-40%.在个体人力成本不断上升.智慧运营管理理念不断渗透的今天, ...