【金猿技术展】亚信科技智能运维——关键指标异常检测技术
亚信科技技术
大数据产业创新服务媒体
——聚焦数据 · 改变商业
随着5G、云计算和微服务等技术的发展,IT系统结构愈发复杂、技术组件愈发多样,传统的运维手段在监控告警和根因定位等方面面临诸多挑战。
亚信科技聚焦基础运维系统痛点,围绕故障发现、诊断、处置、预防全流程以及智能问答、资源优化等典型场景和需求,进行AI算法创新,并将能力进行组件化封装,为运维系统注智赋能。故障发现方面自研了无监督学习的关键性能指标智能检测技术,具有优秀的准确性、时效性和不同特征数据的自适应性等特点,可灵活适配于多类复杂运维场景关键指标监控。
运维领域中,对关键指标进行监控告警是发现问题的常用方法。传统的异常告警方式多以专家静态阈值为主,为了尽可能提高异常检测的准确性,需要人工根据经验针对不同类型、不同实例的指标分别设置,配置和维护工作量极大,无法实现全网覆盖;同时,静态阈值灵活度低、一旦业务发生变更,阈值则可能失效,且对周期内的局部异常不敏感。行业内虽针对异常检测领域已有部分经典算法模型,但由于运维指标种类繁多,数量庞大,数据形态特征差异较大,相关算法直接应用在运维场景效果并不理想。
为了更好的适应运维场景异常检测需求,亚信科技将适应不同特征数据的异常检测算法进行改进和组合,自研了OCDT异常检测算法, 可自适用于多类复杂场景关键性能指标的监控。
本技术方案基于大量的KPI历史数据样本,构建无监督的异常检测模型,自动化识别数据波动特征,并针对不同波动特征数据选用差异化的算法进行模型训练,然后通过判断实时指标是否在智能推断出的置信区间内进行实时异常诊断,同时结合业务规约进行异常告警聚合和上报。
运营数据显示,OCDT异常检测算法的故障查全可达到99%,查准可达90%以上,相比LSTM等开源算法,资源消耗可以降低50%。
本技术方案已申请发明专利。
●带队负责人:欧阳晔 博士
●隶属机构:亚信科技
亚信科技(股票代码:01675.HK)始于1993年,是领先的软件产品、解决方案和服务提供商,致力于成为5G时代大型企业数字化转型的使能者。
公司积极拥抱5G、云计算、大数据、AI、物联网等先进技术,秉承”一巩固、三发展"战略,依托产品、服务、运营和集成能力,在传统业务方面,以5G为契机,全面布局,提升效能,巩固BSS市场领导者地位;在新兴业务方面,力争5G OSS网络智能化业务、DSaaS数字化运营业务、垂直行业及企业上云业务的规模化发展。同时,亚信科技与业界伙伴共建生态,推动商业模式转变,为全行业数字化转型和产业可持续发展贡献力量。
亚信科技AIOps技术已广泛应用于国内各大电信运营商的智能运维实践,并适用于电力、广电、金融、能源等行业。亚信科技已申请多项智能运维相关的技术专利和国际标准,落地质量保障、成本管理和效率提升等方面的40余个场景,支持秒级故障根因定位,提前小时级进行风险预警,相关能力获得客户和业界的高度认可。
亚信科技AIOps还获得了多项行业奖项,包括2020第三届国际AIOps挑战赛亚军, TMF亚洲峰会“最佳催化剂奖”等,“跨域智能告警根因分析”等案例被收录到GSMA《智能自治网络案例报告》并在其门户发布。
图:2020国际AIOps挑战赛亚军
图:TMF亚洲峰会最佳催化剂奖
图:GSMA《AI in Network》优秀案例