洪水是怎样预报的，如何保证精度 / 开普饭

在你不曾发现我的日子里，我也无时无刻不在等你

感恩所有的相遇

“

洪水无情，但我们在努力

”

/我的耳机，分你一半

总体而言，相较于社会上各行各业的从业人员，水文毕业的学生数量相对较少，人们对于洪水预报的方式，以及目前保证预报精度的各类方法还缺乏了解。秋荻通过对当初发布在知乎上的文章，进行文字精简并进一步梳理，与阅读本文的你进行一次通俗易懂的讲解。

本文将采用三个章节来讲述本次话题。第一章主要介绍洪水预报的一些基础知识，方便非水利行业的读者也可以顺利的理解本文讲解的内容。第二章主要谈一下洪水预报的发展，以及当下我们是如何进行洪水预报的。第三章则重点聊一聊保证预报准确度的各种方法。

目录如下：

Part1洪水预报的基础常识

Part2洪水预报的发展与预报方式

Part3保障洪水预报准确度的常用方法

Part 1 ：洪水预报基础常识

为方便非水利相关专业的读者理解，本章节将对水文预报工作中一些基础知识进行简单的科普，水利相关专业的学生和从业者可以从Part2开始阅读。

1）流域：指由分水线所包围的河流集水区。简单而言，可以认为降落在同一个区域范围内的雨水，即便初始的流动方向不同，但最终所有雨水均将汇聚到同一条河道，这个范围内的所有区域称为同一个流域。

2）洪水预报：指应用技术手段，依据前期和现时的水文、气象等信息，对特定河道断面将要发生的洪水过程进行预测的一种应用科学技术。常见的洪水预报的特定地点，一般位于流域的出水口，大型河道交汇处，大型湖泊和水库的进水口和出水口、重点水利设施所在的监测河道断面处等位置。洪水预报一般应用于大中型流域，而小型流域包括洪水传播速度过快的山区更多采用的是预警模式。针对一场洪水过程的预报，从业者对预报准确度的评价首要关注的是洪峰流量、峰现时间和洪水的径流深，然后才是整个洪水过程，包括洪水的水位和流量过程。

3）洪峰流量：指洪水过程中的最大流量，洪峰预报的准确与否，决定着该场洪水可能会造成的最大损失，因而可以说是预报的最重要指标。

4）峰现时间和峰现时差：峰现时间指洪水过程中最大流量发生的具体时刻。峰现时差指预报过程中最大洪水流量出现的时刻与实际洪水过程中洪水最大流量出现时刻的差值，单位一般为小时。

5）径流量和径流深：径流量通俗而言是指一场洪水的总水量，即累积洪水的体积；径流深指的是将洪水的体积除以整个流域的面积后，计算得到的累积洪水水深，采用mm为单位。

6）降水：降水是降雨和降雪的统称。洪水预报中通常涉及的是降雨，部分地区额外考虑降雪。降雨深的概念参照径流深，采用mm为单位。

7）预见期：指发出洪水预报结果的时刻，距离洪水预报事件在实际中发生所间隔的时间。一个流域洪水的产生，从流域上游传递到下游会有一个时间差，过去的洪水预报通常采用实际监测得到的降雨数据，对下游河道断面的洪水流量进行预报，该种方式下洪水的预见期不会超过洪水从上游流动到下游的传播时间。好处在于采用实测数据，预报的准确性相对较高，不足之处在于如果降雨过程还在继续，预报的结果必然偏小。而目前开展洪水预报工作时，从业人员会引入气象预报数据、历史相似降雨事件数据等方式，使得可以提前更长时间对于下游洪水流量过程进行预报，好处在于大大延长了预见期，可以更早的开展防护工作，坏处在于目前的降雨预报的精度太低，发生极端洪水事件时屡屡为人所诟病。

8）历史洪水模拟：目前在校生以及非水文预报的工作者，接触到的洪水预报知识主要都是历史洪水模拟。即在洪水发生以后，整场洪水过程的所有降雨、预报断面的流量数据都已知的情况下进行的模拟洪水预报，虽然与实时洪水预报的核心部分是一样的，但在代码实现方面进行了较多的简化。只学习过历史洪水模拟的人士在进行洪水预报相关研究时容易出现众多问题，例如：某些论文会提出一种洪水预报的新方法，但该方法中应用的某些要素是整场洪水结束后经过统计才能得到的数据，即用着未来的数据资料进行着之前时刻的洪水过程预报。这样的论文，如果内容侧重于探究水文要素与洪水过程的相关性，水文特性等，还是具有一定价值的，但如果侧重于实际预报工作的话，就有待商榷了。

9）实时洪水预报：相较于历史洪水预报，实时洪水预报指的是在实际洪水预报工作中，采用当前及过去时刻可以获取的各类资料，实时对未来洪水过程进行预报的技术方式。实时预报的准确性要求对于从业者而言是相当高的，例如预报未来三个小时，某个河道断面洪水流量的大小，三个小时后就可以拿到实测的数据进行对比，从而得知准确与否，因而部分水文专业的学生，通常会对洪水预报工作敬而远之。本人就遇到过多位，因为历史洪水模拟（还没开展过难度更大的实时洪水预报）的效果不如人意，后续就决定选择从事其他研究方向的在校生，毕竟同样的努力，何必从事发论文效率偏低的方向。理论上，水文方向的在校生或水利工作者均应该开展实时洪水预报方面的教学，但实际上国内的水文资料均为涉密资料，管理较为严格，从业者通常无法取得多年连续的水文资料，即便是高校或研究机构也只能获得部分洪水摘录的水文年鉴，从而难以开展深入的教学，更不用提部分高校教师的研究方向更多侧重于新技术和科研方向，而不是工程方向的实际预报工作。

Part 2 洪水预报的发展与预报方式

洪水预报的基础常识讲解完了，那我们便进入正题，要说洪水预报的方式，就不得不从洪水预报的发展谈起，让我们看一看历史上人们是怎样开展洪水预报工作的。

依据文献记载，人们对于洪水特性的认知最早可以追溯到1674年，法国人Perreault在塞纳河流域依据多年的观测情况，总结出一个规律，该流域的多年径流量（洪水的总体积）与降雨量间存在的比例关系约为1/6。即如果今天降雨的总量为6个立方米，那么洪水就应该有1个立方米。

于是乎要知道洪水有多少，只要知道整个流域降雨的总量就可以了，虽然降雨的总量无法直接获得，但流域的面积还是较为简单测量的，如果可以获得该流域上降雨的平均深度，两者计算一个乘积，那降雨的总量不就有了吗？

于是人们开始在流域内均匀的布设观测降雨深度的仪器，通过整合各个仪器监测的数据，进行求平均值，对整个流域的降雨深进行估算。解决了降雨的水量问题，当地洪水的水量情况就可以开展估算了。

但实际上每个流域降雨和洪水的比例并不是一个固定值，洪水的水量还与土壤的干湿程度等情况有关。正因为如此，一些有经验的老水利工作者，可以依旧经验，在看到最近的土壤植被情况，结合上游的降雨和水位，脑袋一拍就直接说出下游大概会达到多少水位。如果你问他为什么，他也说不出原因，只能说是数十年的经验积累。这就是洪水预报的最初阶段，纯经验预报法。

但洪水预报毕竟是一项非常专业的工作，完全依赖经验可不行。于是水文工作者试着将各种情况记录下来，希望通过大数据分析的方式得到蕴含其中的规律，从而推动了经验预报方法的进一步发展，并形成了众多的成果。

1）相应水文流量法：

通过记录上游河道的水位（或流量等数据），以及历史上该水位传播到下游所需的时间T和下游的河道水位，绘制成图，并构建经验公式的方法。以后在获取到上游水位数据时，通过计算即可大概率推算到下游T小时后应该达到的水位结果。作为一种经验方法，一般流域的面积越大，准确度也会越高。

相应水文流量法程序实现图

相应水位流量法只考虑了上下游水位流量关系以及传播时间的经验方法，而实际上可以纳入洪水预报的因素是非常多的，还包含降雨前期的土壤干湿情况（因为土壤干湿程度不好判断，部分研究采用前期降雨情况代替）、地表蒸发情况、季节、降雨的中心位置、降雨的大小等一系列因素。各地水文工作者会依据自身需求，选用其中的几个重要要素构建当地的预报方法，又称为多变量相关图法。

2）降雨径流相关图法

在众多的多变量相关图法中，作为知名的要数降雨径流相关图法。该方法不选择从水位出发，而是直接从降雨的层面出发，开展洪水总量的预报。虽然各地应用的种类多少有些差异，但都具有相同的原理。

该方法认为一个流域可以容纳的总水量是固定的，之所以每次洪水情况不一样是因为整个流域土壤的干湿深度不一样，因为土壤的干湿程度难以获取，因而采用前期的降雨情况代替。当土壤完全达到饱和（达到土壤吸收水分的最大值）之后，降雨量就应该完全转化为增加的洪水量，即两者是1比1的关系。

只要已知前期的累积降雨深PA，和当前时刻降雨深P，两者相加之和之后，查图就可以获取当前时刻的累积径流深R（洪水累积总水量的深度），与上一个时刻的值相减就可以得到当前时刻增加的径流深（增加的洪水量的深度）。有了径流深，就可以应用水文学者研究而来的各种计算洪水的方法来开展洪水预报工作了。

降雨径流相关图法实现图

3）单位线法

在水文模型相关研究的早期，降雨径流相关图法通常用于和单位线法相结合，用于计算指定河段的流量过程。

例如我们已经使用降雨径流相关图法，计算得到了当前时刻整个流域产生的洪水量为60个立方，但这60个立方的洪水并不是一瞬间从整个流域产生并突然到达流域出口的，正常而言，距离流域出口近的洪水会率先达到出口，距离流域出口远的则会较晚到达出口。而单位线法就是用于再现洪水到达流域出口时间差异的径流再分配过程，这一过程在水文上人们称之为汇流过程，而之前计算得到径流深的过程被称为产流过程。

传统的单位线一般用于计算地表径流的汇流过程，称之为地表径流单位线。也有地区处于简化计算的考量，不区分地表、壤中和地下径流，采用可以直接计算流域出口流量的单位线。理论上而言，单位线的计算方式并不复杂，例如本文附图的单位线，采用的是多元回归方程拟合得到的用于完整径流成分计算的单位线，该单位线在有必要的情况下（考虑美观的情况下）可以进一步进行人工修匀。

单位线法拟合成果图

单位线法作为一种较为传统的方法，应用于实际洪水预报中效果如图所示。

单位线法历史模拟图

可以说，在初始径流深较为准确的情况下，单位线法预报的精度还是可以的，但难点之一在于初始的径流深难以准确估计，影响到了该方法应用于实际预报中的前景。

当然该方法也存在众多劣势，例如图中后续模拟径流中出现了两个200个流量的小洪峰，但实测值却很平稳。这是因为洪水汇流的快慢以及洪水涨落的程度其实是与降雨的强度、降雨的位置等多方面要素有关联的，因而采用一条固定的单位线就难以都取得满意的效果。但依据降雨强度（注意该数值为计算的平均值）和降雨中心位置（可能存在多降雨中心）的不同绘制多条单位线，又难以保证每次都选用了最合适的单位线，存在错选的风险。所以实际工作中更多情况是选用具有代表性的主要考虑大雨强，降雨高发区域对应的单位线来在实际应用中开展工作，来满足对洪峰预报的目的，毕竟洪水的峰值才是危害最大，各方最为关注的。

考虑到单位线法计算存在的种种问题，水文学者进一步研究，开发出了预报更为准确的洪水预报方法，称之为概念性水文模型。相较于之前的经验性洪水预报方法，概念性水文模型对水文现象进行了种种假设，并引入了一部分水文特性的概念，在实际应用中取得了更为好的预报效果。

以国内水文领域概念性水文模型的翘楚新安江模型为例，该模型由水文专家赵人俊教授团队于上世纪七十年代提出，并在八十年代中期发展完善，是国内第一个跨出国门的流域水文模型。

该模型将洪水预报的计算过程划分为四层结构，分别为蒸散发模块，产流模块，水源划分模块和汇流模块。

新安江洪水预报系统结构图

新安江模型本身是一个集总式水文模型，但考虑到集总式水文模型在应对大流域模拟时的效果不佳，水文学者采用以雨量站为依据将大流域划分为大量子流域，分块计算各个子流域出口流量的方式，与马斯京根河道汇流演算方法相结合，求解流域出口断面流量，从而进一步提高了模型预报的精度。

子流域划分图

目前，新安江模型仍然是国内应用最为广泛的水文模型，没有之一。新安江模型的当今地位一方面来自于国内自主研发，历史悠久，另一方面在于其参数众多，具有强大的容错性。

曾经在开展一个中小型流域的历史模拟过程中，因为疏忽一个雨量站的资料整体没有输入进系统，导致水量本身并不平衡。一般情况下水量不平衡意味着不可能得到满意的预报结果，然而在没有发现这一资料漏输的情况下，技术人员依靠长期水文预报积累的经验，经过调节参数，愣是把模拟结果给调准确了。虽然事后通过数据分析存在系统偏差进而发现了这一问题，并重新调整了整套参数，但这段历程给我等亲历者留下了深刻的印象。

以后周边听闻水利同僚诉说新安江模型预报效果不佳时，不免想到究竟是真的在该流域应用效果不好（模型都有适用范围），还是同僚学艺不精忽略了编程时的细节（新安江的核心代码虽然不超过千行，但目前可以找到的代码书上直接抄下来的新安江代码，通常都是早期的版本，在重要细节处都未进行过优化，容易导致能计算出结果，但在部分洪水场次下发生洪峰上不去，适应性不佳等问题。还有一些同僚在大流域预报时不划分子流域，或者直接累加结果而不采用马斯京根汇流的情况也可能发生），再或者问题并非简单出在新安江模型上，而是因为缺乏准确的数据，巧妇难为无米之炊。

新安江模型系统模拟图

曾经和同学细聊时，大家笑说，要是完全没学过预报，也没有懂细节或者有实际经验的前辈指导，照抄代码也能做出很好的结果，那预报工作者就一大半要失业了。不过话说回来，随着水利信息化的兴起，完善成型的水利信息化预报系统早晚会形成，目前的这些技术壁垒大抵也就只能延缓一些年数吧，究竟是延缓十年还是几十年，就让我们这代人拭目以待吧。

当国内概念性水文模型进展的如火如荼时，国外具有物理性质的水文模型正悄悄崛起，虽然目前并没有足够依据表明物理性质的水文模型的预报效果优于概念性水文模型，但具有物理性质这一条就具有足够说服力让人们去使用，尤其是一些将概念性和物理性质相结合的水文模型更是走得非常广阔，而国内的水文模型要得到世界各地的广泛认可和应用，仍有较长的路要走。

也许读者会感到疑问，为什么具有物理性质的水文模型预报的精度不一定更好，其实答案很简单，现实世界中的大量数据都是难以准确获得的，更何况物理性质的模型中的各类参数，相较现实世界依旧需要大幅的简化，参数率定工作也较为复杂，计算的繁琐同样会导致容易引进误差，那预报结果的好坏就难说了。

最近数十年，分布式水文模型的浪潮逐渐袭来，所有模型似乎都要摇身一变，加入分布式水文模型的架构之中。所谓分布式水文模型，通俗而言就是将整个流域划分为众多子流域，然后依据每个子流域不同的土地利用类型、土壤、植被、坡度等条件，针对每个子流域采用不同的参数或计算方法的一种洪水预报方法。相比于之前提到的半分布式新安江模型，分布式模型划分子流域和参数的精细程度可谓是以数十乃至数百倍增加。但相对于具有物理概念的水文模型，一旦采用分布式模型的架构，对于数据的要求又进一步大幅的增加，但是分布式模型的一个关键的好处在于，模拟结果的分块计算和展示，在报告宣传等方面具有显著的优势，方便汇报工作和信息化展示成果。同时构建分布式模型的也是目前主流的进展方向。

Part 3 保障洪水预报准确度的常用方法

要谈保障洪水预报准确度的方法，就要先知道洪水预报准确度的评价方法和概念。要明白水文上说的准确性和大家平时认知中的准确性是一定差异的。

就像医学上说的某些疾病可以治愈，但老百姓却并不买账。病友协会明确写了所有号称可以治愈某些疾病的都是骗子，医生怎么可以说这病已经可以治愈了？这就是专业人士和社会大众在交流不足下引发的困扰，医学上说的治愈通常指的是症状基本消退、身体机能恢复正常的临床治愈，而老百姓口中的治愈，实际上是医学上的痊愈。

PART3.1 评价标准

在洪水预报方面判断预报的准确性，通常是参照水利部发表的水文情报预报规范中的标准。

简而言之，对于一场洪水，我们主要关注洪水的峰值、峰现时间和径流量三个重要指标。规范中对于单场洪水这三个指标的预报允许误差评定标准如下：

1 洪峰预报许可误差。降雨径流预报以实测洪峰流量的20%作为许可误差;河道流量(水位)预报以预见期内实测变幅的20%作为许可误差。当流量许可误差小于实测值的5%时，取流量实测值的5%，当水位许可误差小于实测洪峰流量的5%所相应的水位幅度值或小于0.10m时，则以该值作为许可误差。

2 峰现时间预报许可误差。峰现时间以预报根据时间至实测洪峰出现时间之间时距的30%作为许可误差，当许可误差小于3h或一个计算时段长，则以3h或一个计算时段长作为许可误差。

3 径流深预报许可误差。径流深预报以实测值20%作为许可误差，当该值大于20mm时，取20mm;当小于3mm时，取3mm。

4 过程预报许可误差。过程预报许可误差规定如下：1) 取预见期内实测变幅的20%作为许可误差，当该流量小于实测值的5%，当水位许可误差小于以相应流量的5%对应的水位幅度值或小于0.10m时，则以该值作为许可误差。2) 预见期内最大变幅的许可误差采用变幅均方差sD，变幅为零的许可误差采用0.3sD，其余变幅的许可误差按上述两值用直线内插法求出。当计算的水位许可误差sD>1.00m时，取1.00m，计算的0.3sD<0.10m时，取0.10m。算出流量许可误差0.3sD小于实测流量的5%时，即以该值为许可误差。

结合以上要求公众认知中的准确性和专业人士的评价差异也就出现了：

1）如果实际洪峰是1000个流量，预报的流量只要在800-1200之间，都属于预报准确的范畴。只是在实际工作中水文工作者更倾向于按预报结果偏大的最不利情况进行洪水防范。

2）采用洪水预报的流域通常流域面积不会小，预报的时间单位一般为1小时，因为单位是小时，所以峰现时间的偏差也就一偏差就是1个小时。所以当老百姓听到预报的结果竟然差了一个小时的时候，不要激动，在很多情况下这已经是非常不错的预报了。

3）采用洪水预报的流域通常面积都不会小，那小流域怎么办。目前对于小流域和山洪高发区域，一般倾向于采用的方式是预警机制，因为小流域的洪水陡涨陡落，一两个小时内就会造成重大后果，从业者会依据降雨情况，直接发布预警避难通知。相对而言，预警机制的构建相对预报难度更大，因为气象预报的准确度并不高，很容易造成发布预警了，可实际并无风险的情况。不过作为保障洪水风险的重要预警通知，还请当地人民千万要重视，这不是狼来了的故事。

在三个核心指标中，洪峰和峰现时间的关注远超径流量指标，并且径流量指标一般是在洪水险情结束后，后续梳理完成后才进行判断的指标。但在洪水预报系统完善的地区，径流量指标作为实时洪水过程修正的重要依据之一，同时也是洪水参数率定和校准的重要依据，依旧有着重要的作用。

看到这里，各位读者是不是以为洪水预报就是制作一套预报模型，跑出一个结果，预报就完成了，剩下的就是结果上报，领导决策，各方抢险了？实际上的洪水预报流程可是远比这复杂得多。仅仅从洪水预报模型的角度而言，一个大流域就绝对不会只使用一种预报模型。没有人可以保证如果只采用一套预报模型，这套模型在某些关键的预报时刻会不会发生故障，其次也无法保证单一预报模型的预报结果就一定是贴近实际情况的。因而采用多套不同特性的水文预报模型，互为保险的情况，可以说是最为基本的方式。

即便对于险情很少，经济条件不允许构建完善洪水预报系统，仅仅构建有一套洪水预报模型的地方，也会针对不同情况采用一套模型报出多种预报结果进行后续判断。比方说：采用上文介绍的单位线法的地区，就可能针对不同降雨中心位置，不同雨强构建多条单位线，不同的降雨情况下采用不同的单位线进行预报，同时依据实时降雨情况，同时列出最合适的某几条单位线下的预报结果，供专业人士进行后续的分析。

面对众多洪水预报模型报出的预报值，采信其中哪一套的预报结果，开展相应的后续工作，对于专业人士和领导都是一件并不容易的事情。尤其是在面对重大险情之时，各区域的领导更是连夜进行视频防洪会商，此时此刻，各地区采用各自的数十上百套预报模型预报出的洪水结果，同时呈现在领导和专家面前，分区域梳理，综合考量，最后讨论出最为适宜的下一步行动。他们虽然未必需要走到防洪抗灾的现场，但他们的每一个决断都承载着重大的责任，关乎着千家万户的生命财产安全。人们通常只能看到某场洪灾肆虐后的一片狼藉，却很难意识到在一场洪水背后可能有数十倍数目的洪灾被水文工作者消弭于早期的阶段而不为人知。

谈了一些防洪的工作，让我们把话题回到洪水预报的准确性来。既然单场洪水的预报评价标准上文已经列举了，那我们对单个洪水预报模型的准确性是如何评价的，水文情报预报规范中同样有提供相应的标准：

一个流域在采用一套水文模型之前，通常需要进行洪水预报方案的编制，其中就需要对模型的预报精度进行评定，评定的方法就是采用历史上发生过的洪水数据，用这套模型进行模拟。依据模拟情况下合格的洪水场次除以总场次得到的就是合格率。而确定性系数是针对单场洪水模拟整体准确情况的一个系数，将所有场次计算得到的确定性系数进行求平均值，就是方案评定时采用的最终结果。

对于这两个指标，接下来由我来为大家进行讲解影藏其中的各类门道。

首先是合格率，合格率指的是如果一场洪水在模拟的情况下同时满足了洪峰、峰现时间以及径流深的允许误差标准，这场洪水即为合格。多场洪水进行评定时，合格率为合格的场次数目除以总场次。

认真阅读了本文的读者一定会发现在这里我用了模拟两个字。是的，这里的模拟和第一章节水文基础常识中提到的历史洪水模拟是一个意思。方案评定过程中采用的方法是历史数据下的洪水模拟，而不是采用历史洪水数据，进行实时预报下的模拟预报，两者都含有模拟两个字，但差别是很明显的。

例如在历史洪水模拟情况下，初始的土壤含水量等信息是需要人为调节的，但在实际工作中该值一般是连续演算得到的，而在人为调节过程中，因为无法确定实际的数据，就有可能造成人为提高预报精度的结果，应用该种方式下做出的模拟效果，通常较实际预报下的结果会偏好。出于各种客观原因，相当多的水利院校在校生没有经历过实时洪水预报过程的学习，不少同仁会认为模型的模拟结果，完全是可以任人随意提高精度的花架子，只能用于发文章，甚至部分水文科班出身的研究生也持有相近观点，但其实如果他们参与到实时洪水预报工作中就会发现，初始数据其实是不能随意、调节的，每一次调节都是需要技术支撑和担责的。有了以上认知，我们就可以明白，报告上的合格率其实是该模型在历史模拟时合格率的平均值，在实时洪水预报时该模型如果不进行改进，那这个值可以作为实时洪水预报时可以达到的合格率的上限值。所以如果你看到报告上说预报的合格率达到了95%，那实际上通常预报效果是略低于这个合格率的，这属于正常现象。

说完了合格率，我们来看确定性系数。采用确定性系数的好处在于用指标的方式展示预报结果和实测结果的接近程度。但是但凡学习过数理统计的人士，都知道不能盲目的迷信指标。因为一方面该指标体现的是整体的接近程度，也就是说可能会忽略洪水峰值的接近程度，例如确定性系数达到了0.9以上的模拟洪水，绘图后可能发现模拟的洪水过程完全没有洪峰，这样的预报实际上是失败的。另一方面，水文上应用的确定性系数并没有纳入模拟洪水系列的长度这一要素，由于洪水峰值模拟准确的难度大于非峰值，故而通过增长洪水系列非峰值的系列长度，就可能使得纸面上的确定性系数得到提升，但对于实际洪水预报工作这样方式提高的准确性并没有价值。

知道了以上知识点，大家看到方案精度编制上写着甲级时，就不会产生盲目崇拜，在看到自己的预报结果与报告上有一定偏差时也不会过于妄自菲薄了。

PART3.2 人工智能算法和分布式水文模型——是否真的可以提高预报精度

非水利相关的人士，可能会认为提高洪水预报准确性，最好的方式就是将最新的技术成果引入到洪水预报中，采用更先进的洪水预报方法。

在一定程度上，这个观点是正确的，毕竟最新的成果能引入总是好的，不过历史的经验告诉我们，一种新的方法从学术上发文章，离在实际工程中的较好的发挥作用往往存在较大的距离。从事实际工作，更多的还是应该从预报的效果出发，而不是盲目相信新的方法一定会有更好的效果。

再此，我将以目前在概念上比较火的人工智能算法和分布式水文模型作为举例来进行讲解。

1、首先让我们来看下近年来较为火热的人工智能算法，在实际洪水预报工作中可能会遇到的问题：

三层结构BP人工神经网络示意图

1）人工智能算法属于机器学习算法，要学习就需要大量的数据，然而目前的现状是连续多年的水文数据获取并不容易。

2）机器学习是通过对历史数据的训练，找出蕴含于内部的规律从而对未来的水文情况进行预报，但是目前众多的流域因为受到人类活动的影响，过去的地形地貌和地表情况已经发生了变化，过去的水文数据蕴含的规律和现在的规律存在差异。

3）机器学习算法是通过过去的数据进行预报，但历史有观测的数据最多也就只有几十年，在面对几十年一遇乃至百年一遇洪水的情况下，可能失效。

4）机器学习算法难以维护，随着经济水平的提升，全国各地都在不断新建水文观测站点。但通过旧站点训练形成的人工神经网络模型，无法融入新建站点的观测数据。

5）机器学习算法存在过拟合的可能性，虽然在国内数据量的情况下，这个问题比较少见而且有一定的规避方式，但技术人员的专业水平难以保证依旧可能发生问题。

6）机器学习算法属于黑箱模型，技术人员难以从最终的参数中判断出内在逻辑，无法保证在关键时刻预报时不会出故障。

7）机器学习算法的预报结果没有水文意义，难以在保证预见期的前提下应用实时修正算法对预报的结果进行改进。

人工智能算法在个别时刻发生突然失效的结果示意图

既然人工智能算法在洪水预报应用中，可能存在这么多的问题，该方法是不是就不该应用了呢，答案显然也是否定的。

洪水预报的决策本身就是在众多模型同时预报下进行的，人工智能算法作为一种新增的参考模型必然具有一定的参考价值。其次，对于长系列水文资料充足，且人类活动影响变化不明显的地区，人工智能算法基于其强大的学习能力，通常可以进行远高于常规水文预报精度的洪水模拟，这样的流域在经济欠发达地区目前而言还很多。在人工智能算法预报出现问题的时刻，完全可以再参考其他已有的水文模型预报结果，互为保障发挥更好的作用。

只能说基于目前水文预报规律的变化情况，人工智能算法在该领域难以充分发挥出自身的长处。

人工神经网络预报图

2、接下来让我们看一看正如火如荼进展中的分布式水文模型。

人们逐渐意识到，流域内各个区域的水文特性存在差异，不同区域的产流汇聚到流域出口断面的时间也有较大差异，需要进一步细化，将流域划分为众多的子流域并依据特性采用不同的水文参数进行分布式模型构建的重要性。

最早的分布式水文模型服务的目的并非是防洪，其实水文模型的应用极为广泛，除了防洪之外，还有农田管理、水质模拟（农药等各种污染物）、泥沙模拟（水土保持）等众多的问题，故而人们逐渐开发出了结合土地利用、气象、土壤等众多自然要素在原理上更贴近实际自然情况的分布式水文模型。例如在国内最为常见的分布式水文模型SWAT模型，英文原文直译的话就是泥沙-水评估管理工具，也印证了其最初开发的初衷。

SWAT模型应用时采用的土壤类型分布图和土地利用分布图

目前分布式水文模型并没有在市场上占据主导地位，可能的原因如下：

1）国内各类高精度数据获取的难度较高，即便拿到了数据也难以保证数据的准确性和时效性。

2）分布式水文模型适用于大型流域，小流域难以应用。而大型流域本身就可以划分为众多的小流域分块演算，并非一定要使用分布式水文模型。

3）目前众多研究得出的结论下，并没有支持分布式水文模型的洪水预报效果普遍优于非分布式水文模型的结论，在很多流域，简单的模型可能反而会取得更好的模拟效果。

但与人工智能算法不同，分布式水文模型遇到的困难中大部分都是随着经济的发展逐渐可以得到解决的，例如获取高精度的数据，时效性数据等。而且分布式模型在理论上详实，迎合了水利信息化发展的趋势，在模拟效果展示以及在报告中展示都有着明显的优势，必然是今后发展的重大方向。

PART3.3 实时修正——提升洪水预报模型精度的利器

谈完了目前比较热门的两大类洪水预报概念下的模型，那我们常规的洪水预报过程中，是如何提高预报的精度的呢，答案就是前文已经提到的实时修正算法。

1、实时修正的目的是什么

实时修正顾名思义就是依据当前的预报结果和实测的情况进行比较后，对预报的一些中间变量或结果进行修改，目的在于获得未来预报结果精度的提升。

在一些文章中，作者将实时修正的目的错误的认为是使得当前的预报结果更接近真实情况，这里面就存在一些不严谨的问题了：

1）从应用角度而言，当前时刻的真实值已经有了，在有真实值的情况下，当前时刻的预报值就相对并不重要了。

2）通过实时修正使得当前时刻的预报值接近真实值，并不意味着对未来的预报精度一定提高，甚至可能下降。存在一定的可能是强行修正使得当前的预报结果接近了真实值，但破坏了模型内在的降雨径流中间变量应有的数值，导致后续的预报结果出现恶化。

基于此，希望发表实时修正类文章的同僚们可以严谨一些，在模型检验过程或写文章时多增加一些验证，相信你一定可以有更深的体会。

实时修正效果图，图中QO为实测值，XAJ为原始预报值，BPCQ0、BPCQ2、BPCQ4分别为修正后0、2、4小时后仍具有的修正效果展示图。多个小时后仍然优于原始预报结果，证明该修正方法是有效的。

首先让我们来看一看过去人们是怎样进行实时修正的。

一个流域突发暴雨，防洪形式严峻，按照古典的经验公式，人们计算出了接下来数小时的预报结果。大家一看，咦，和现在的实际情况偏差还是挺大的。怎么办呢，当然是快去请当地从事了三四十年的老专家，老专家看看天空的暴雨和窗外的江水，望了望经验公式计算出的结果，沉思片刻，走上前去拿笔把经验公式前一个小时的某个输入量改为了原先的60%，拍拍手上的灰，道一句：可以了，你们计算去吧。工作人员一阵忙活重新计算了预报的结果。还别说，确实准确多了。这就是最早的依靠经验对预报情况进行的实时修正，当然现在完全依靠经验的情况已经很少了，更多的是采用各种有效的算法。

从师姐那Copy过来的实时修正效果图

实时修正效果图中背景的红色虚线是实测值，黄色小球是没有采用实时修正的预报结果，红色小球是采用实时修正后的预报结果，可以看到修正后的结果与实测值更为接近。

个人接触过的实时修正算法有：AR自回归模型、递推最小二乘法（动态更新的AR模型）、BP神经网络算法、动态系统响应方法、集合卡尔曼滤波算法等，本文主要是为非专业人士谈一下洪水预报的常用方法，故不做过于原理的详细描述，有兴趣的专业人士可以自行学习相关的书籍。

1）AR自回归模型、递推最小二乘法（动态更新的AR模型）：均属于自回归模型，差别在于前者对从一开始到预报时刻的所有值进行修正，而后者动态更新，采用相近的数个时刻的数据进行修正。在一般情况下，相近时刻的数据更能反映真实的情况，因而递推最小二乘法的修正效果更佳。自回归模型之所以可以取得较好的效果，是因为水文过程各时刻的结果具有连续性和相关性，所以如果是在水流起伏变动非常剧烈的流域例如部分水库流域就不一定适用了，而且该类方法在水文预见期方面应用效果不佳，更适用于短时段的预报结果修正。但该类方法具有算法简单，对数据量要求较少等优点，因而应用非常广泛。

2）BP神经网络算法修正：上文已经提及，该方法主要适用于具有多年连续数据，且变化较少的流域。该方法因为缺少水文概念上的意义，应用受到一定限制。适用于短时段预报结果的修正，不适宜长时段预报结果的修正。

3）动态系统响应算法：是一种可以保留预见期的非线性修正方法，算法上纳入了最小二乘的思想，理论上可以对过去任意长度的时段结果同时修正，但实际应用时为避免修正结果出现与水文实际不相符的情况，一般采用修正过去单个时段的方式。修正后的流量有一定几率出现波动，修正的幅度可能需要进行一定的限制或者引入相应的规避波动的算法。该方法因为具有较好的水文概念，可以应用于长时段预报结果的修正。

4）集合卡尔曼滤波算法：是一种可以保留预见期的非线性修正方法，算法上采用了蒙特卡洛算法的思想。原本是模式识别和控制理论中的方法，引入到水文中后获得了较广的认同，在数据同化和修正方面都有较多的应用。看过原理后个人认为是一种比较可靠的修正算法。

不同实时修正算法结果比较图（仅代表在研究流域的结果，不代表算法的优劣），QO是实测值，XAJ是原始预报值，BPC是将BP神经网络算法对水文模型中间变量进行实时修正的结果，AR（2）是动态更新的AR模型即递推最小二乘算法实时修正的结果。

PART3.4 现实的无奈

前文讲解的内容主体为书本上涉及较多的理论部分，现在让我们看看实际水文预报工作的一些困难，也是洪水预报工作容易被诟病的地方。

1）数据资料的缺失：一个实用的水文模型投入应用之前，长系列，高精度的水文资料是必不可少的。只有经受住检验的预报方法才能投入工程中去，但实际上国内数据获取的难度非常之大，高校拿不到足够数据培养学生，而工程单位以赚钱为目的也不会愿意花高价购买数据。

2）经济发展下人类活动的影响：地形地貌、土地利用等情况随着人类经济活动迅速改变，大开大建，历史数据往往不能很好反映现状，加大了建模的难度。而且土地硬质化之后，如果没有防护调蓄措施，现在四五十年一遇的降雨可能就能引发历史上百年一遇的洪水程度。

3）数据的时效性不够，土地开发情况，河道变更情况，上游排水信息，各类应该且必要的数据没有及时上报系统，缺失时效性数据直接影响最终的预报阶段。

4）天气预报精度的限制。洪水预报是基于降雨准确性下的预报方法，依靠实测降雨对未来的洪水进行预报。因为缺少未来降雨信息必然会导致预报存在一定的偏差，而目前降雨的预报精度还有待提高。虽然实际洪水预报时通常会构建多重可能未来降雨的系列进行各种假定降雨情况下洪水过程模拟的结果作为参考，但依旧限制了洪水预报精度的进一步提升。

5）人为的失误。上报的数据是否真实准确，设备的维护是否到位，河道是否疏浚，防洪工程是否没有缺漏，防洪预案是否准备妥当，泄洪区是否做到了不进行经济发展。越是基层，专业人士越少，各类工程的进展和执行到位往往越是困难。

附带曾经与水文一位博士的闲聊，大体是说原本万事具备，洪水预报系统很完善，模拟理应很好。结果模拟当天，上游水库突然多排了些水没有通知，中游老爷爷种地偷偷占掉了部分河道，市里的自动化监测维护人员对坏掉的个别雨量站忘记了维护，而下游的洪水预报人员看着模拟结果没有洪水风险，正吃着火锅唱着歌，然后结果可想而知。此处水文预报工作者请微笑。

那么现今的洪水预报工作对以上的现实困境是否毫无应对之力呢，这样的情况显然也是不会发生的。专业人士在安排防洪工作时都会设置充足的保险量，就像工程会有安全系数，如果众多模型和专业人员讨论后的最终预报的结论是5000个流量，可能当场领导就会下指示按照6000个流量及以上的最坏结果进行防范，确保防洪工作的万无一失。其中的流量差值，就是专业人员采用的保险量。

目前强降雨下，城市排水不畅，其实更多的是城市规划和市政工程的建设节奏赶不上经济水平的发展，更多的问题在于那是内涝，而不是洪水。当然也有相当多的城市紧靠山区却没有修建排洪渠，明知城市有洪水风险，却寄希望于超标准洪水几十年内不会发生，因资金关系而不急于补上防洪缺口。相信随着城市洪水发生频率的逐渐增大，各级政府对于防洪工程的关注度必然越发重视，水利建设上的短板必然会得以补齐。

本文的最后，让我们感谢所有洪水预报工程人员的辛勤工作，是他们的不懈付出，使广大人民的生活得以免于洪水的肆虐。

感谢你阅读到这里，关心防洪事业的你一定很棒

end

文 | 秋荻

洪水是怎样预报的，如何保证精度

目录如下：

相关推荐