基于聚类算法的供水管网爆管识别技术
爆管是一个困扰供水行业的典型问题,其往往伴随着短时的大水量漏失,不仅造成水资源的严重浪费,同时导致的压力下降也会影响正常供水。更有研究与实践经验表明,爆管能够造成水质恶化,城市中发生的严重爆管事故甚至会引发道路积水、交通中断、地面塌陷等次生灾害。因此,如何及时发现管网中的爆管事故,对于快速响应和减小其影响具有重要意义。
近年来,数据采集与监视控制(SCADA)系统已广泛应用于城市供水管网中,分区计量(DMA)也越来越受到重视,供水企业逐渐积累了大量的在线监测数据。因此,基于数据挖掘的爆管识别方法开始得到关注与研究。来自于清华大学环境学院的研究人员利用流量监测数据,探索了基于数据挖掘的爆管识别方法,并在中国绍兴供水管网的DMA上的成功应用。
研究中选取了一个具有两个进水口和三个出水口的DMA,图1A和图1C分别表示DMA五个流量计一天内的流量数据,前者由于受到该DMA下游区域管网冲洗的影响,在夜间有一次水量突增的情况(图1B所示);后者则包含了一次DMA内发生的真实爆管事故,与管网清洗不同,真实爆管引起的每个流量计的变化不尽相同,入口处的流量数值增加明显,而出口处的流量数值甚至出现了减小的情况(图1D所示)。
▲ 图1 DMA流量数据特征
从图1中可以看出,1)DMA中各个流量计的读数在时间上有一定的波动性,每个流量数据在一天内的波动较大;2)各个流量计的数据表现出一定的协同性,出口流量计和入口流量计的波动趋势一致;3)爆管和管线冲洗作业都会导致流量计读数突变;4)早上和晚上出现两个用水高峰,而在深夜和凌晨出现了用水低谷,该波动很可能掩盖由爆管引起的流量异常;5)不同的工况会引起DMA进出口流量计不同的波动变化。
表1总结了包含管网冲洗与爆管在内的各种引起DMA流量波动的原因。
▲ 表1 异常情况导致的流量波动特征
通过上述分析可以得知,利用多个相关联流量计的读数变化特征,可能实现对爆管事件的识别。主要通过以下3个步骤实现:1)通过数据转换减小数据波动,为爆管识别创造便利;2)检测出所有流量数据的异常波动;3)在所有异常数据中识别出爆管事件。
为了完成第一个步骤,研究人员把来自不同流量计的数据转化成了矩阵。原始的时间序列数据表示流量随时间的变化,如果数据采集频率为5分钟,则前一数据即代表5分钟前的数据,相邻时间的数据差异可能较大,从而掩盖爆管等异常工况引起的读数波动,不利于实现爆管预警。研究人员发现,每日同一时间点的数据间差异性较小。因此,对原始的时间序列进行切分,构成切分序列,每个序列代表每天同一时刻的数据,若以5min为采集频率,每个流量计都可以生成288段切分序列,切分序列的数据波动范围明显降低。为了把所有流量计的数据关联起来,将来自不同流量计相同时段的切分序列进行组合,构成288个矩阵。
那么如何去检测矩阵中的异常数据呢?在未发生任何事故的情况下,矩阵中每个向量间具有较大的相似度,一旦出现了异常工况(可能是真实爆管,也可能是冲洗作业等),表征异常工况的向量会因为流量数据的增加或减小而与其他向量产生较大差异。基于此,研究人员采用聚类算法来衡量矩阵中向量间的相似度,并依此进行聚类分析,实现对异常向量的识别。
最后,需要在所有异常向量中识别出真正的爆管事件。记异常向量x = (x1, x2, …, xn),计算其原所在矩阵中的均值向量为mean= (m1, m2, …, mn),此均值向量的各个元素都由相应列的均值构成。分析x中的各个元素,以其中较大元素(相较于平均值而言)的个数为标准,将其分为三类(大、小和中等),分别与表1中不同原因(1,2,3)相对应,如表2所示。该步骤通过对异常向量进行分类,可以有效降低最终的误报率。
▲ 表2 异常向量的分类 ; 其中阿拉伯数字指表1中的各类原因, n代表流量计的个数
图2显示了对某一时刻相应矩阵进行聚类分析后的结果。图2B是进行聚类后得到的决策图,描述了所有向量的局部密度(表征本向量周边向量的密集程度)和距离(本向量与具有更高局部密度的向量间的最小距离),星状点是聚类中心,蓝色圆点是正常向量的代表,左上角椭圆区域内的点具有最低的密度,且具有较大距离,因此被识别为异常向量。图2A描绘了5支流量计180天中在某时刻的流量变化曲线,其中方形异常向量是由于10月9日区域下游管道冲洗造成的,所有流量计读数有明显增加;而三角形点代表的异常向量是由于7月27日的爆管造成的,发现出口流量计读数无明显变化甚至降低,而入口流量读数则明显增加。研究表明,该方法能够快速检测出流量为200m3/h(约占DMA瞬时入流量的13%左右)的爆管事件。
▲ 图2 某矩阵的聚类结果
目前,供水管网在线监测数据日趋丰富,如何有效挖掘出在线监测数据中蕴含的信息,支撑管网的科学管理,是供水行业面临的一个挑战。该研究提出的方法,可利用DMA的在线监测数据实现对爆管事件的实时甄别,对于降低管网漏失量,提高管网管理水平,具有较大意义。
参考文献
Wu, Y., Liu, S., Wu, X., Liu, Y. and Guan, Y., 2016.Burst detection in district metering areas using a data driven clusteringalgorithm. Water Research, 100, 28-37.