基于
LSTM
深度
学习
生态
流量
预警
预报
模型
研究
水 文JOURNAL OF CHINA HYDROLOGY第43卷第3期2023年6月Vol.43 No.3Jun.,2023DOI:10.19797/ki.1000-0852.20210529收稿日期:2021-12-20网络首发日期:2023-06-13网络首发地址:https:/ 杭州310009;2.浙江大学 建筑工程学院,浙江 杭州310058;3.浙江水利 水电学院水利与环境工程学院,浙江 杭州310018;4.浙江水文新技术开发经营公司,浙江 杭州310009)摘要:为探究河湖生态流量预报预警机制,进一步改善河湖生态环境,以浙江省椒江流域为研究对象,提出了考虑预警信息的结合熵值法和LSTM的生态流量预报新方法。结果表明:Q90法得出的柏枝岙和沙段断面的生态流量核算值分别为2.89 m3/s和1.92 m3/s,计算结果低于多年平均流量的10%,较为合理可靠;所建模型验证期的纳什效率分别为0.91和0.88,偏差为2.55%和-3.22%,本模型的低水流量模拟效果要优于传统的新安江模型;柏枝岙和沙段断面无预警信息的预报合格率为98.72%和95.38%,有预警信息的预报合格率高达100%和96.61%,满足预报甲级精度,说明该方法较好地完成河湖生态流量预警信息预报任务。关键词:生态流量;熵值法;LSTM;椒江流域中图分类号:TV124;P338文献标识码:A文章编号:1000-0852(2023)03-0065-060引言河湖中的水资源不仅可以促进社会经济的发展,还可以为有机物和生物提供良好的生长环境,维护河流生态健康,改善人类生存环境1。生态流量是指在不干扰河流生态状态的情况下,确保河流保持正常的流量,防止河流功能的收缩、中断和丧失2。然而,由于经济快速发展、人口增长和气候变化,人类社会对水资源的需求急剧增加3,其中生态用水和经济用水的不平衡发展导致河湖基本生态环境的恶化4。解决这一问题的关键是合理有序地开发河湖水资源,建立河湖生态流量预报预警机制,使河流生态系统满足生态可持续发展的要求5。近年来,国内外学者在流域尺度上开展了一系列基于生态信息管理、河流健康评估、生态规划和生态因子的响应机制研究。如李斐等6针对汉江干流生态流量保障和管理现状,提出建立相应生态流量保障措施;江善虎等7通过生态流量阈值分析河流水文健康等级,进而定量分析人类活动和气候变化对河流健康状态演变的影响;Fu 等8在系统分析河流水文状况和生态保护目标的基础上,给出了考虑生态完整性的河流生态流量嵌套计算框架;Hsu等9提出一种将配水优化模型与河流生境模拟系统模型相结合的方法,以论证不同生态基流设置对指示物种水生生境的影响。但是对于生态流量的预报预警机制尚缺乏研究,仅仅通过生态流量评价工作无法有效地制定地区生态流量保障管理措施和改善河湖生态环境。同时,对于集水面积较小的流域,生态流量预警阈值之间的数值差距很小,采用传统的物理模型无法达到较高的预报精度10。因此,以浙江省椒江流域为研究区,分析多种生态流量核算方法的适用性,基于生态流量核算值设置河湖生态流量预警等级,利用熵值法和长短期记忆神经网络(LSTM),构建一种基于第43卷水 文深度学习的河湖生态流量预报预警模型,提高河湖生态流量预警的预报精度,为流域水资源保护监督管理提供参考依据。1研究区概况椒江流域在2020年冬季遭遇较严重的气象干旱,干旱重现期达到50年一遇,当资源型缺水与工程型缺水叠加,造成区域旱情严重,流域干支流多处河段出现断流现象。因此,选择椒江流域作为生态流域预报预警机制的研究区。椒江是台州市最大的河流,浙江省第三大水系,主流全长209 km,介于东经1201412155,北纬28222919之间,总面积6 603 km2(图1)。永安溪为灵江主流,发源于缙云、仙居两县交界的天堂尖,集水面积2 702 km2。始丰溪为椒江水系最大支流,河道天然落差110.5 m,河长128.9 km,河道平均坡降1.9,流域面积1 615.6 km2。伴随着椒江流域地区经济快速发展、人口增长和气候变化,社会对水资源的需求急剧增加,其中生态用水和经济用水的不平衡发展导致河湖基本生态环境的恶化。椒江流域在 2020 年冬季遭遇较严重的气象干旱,干旱重现期达到 50 年一遇,当资源型缺水与工程型缺水叠加,造成区域旱情严重,流域干支流多处河段出现断流现象。因此,本研究选择椒江流域作为生态流域预报预警机制的研究区具有代表性。图1研究区气象站和水文站空间分布Fig.1Spatial distribution of meteorological and hydrological stationsover the study area2研究数据及方法2.1研究数据本文选取椒江流域内柏枝岙和沙段水文站分别作为永安溪和始丰溪生态流量控制断面,具体控制面积和水文气象特征信息如表1所示。本研究所采用19912020年共30年日尺度降雨(26个站点)、水面蒸发(5 个站点)、径流(2 个站点)和水库出库流量(4个水库)数据,且数据资料均来源于浙江省水文管理中心。表1水文站点基本信息Table1Basic information of hydrological stations水文站点柏枝岙沙段所属流域永安溪始丰溪控制面积/km22 4751 482多年平均降雨量/mm1 875.561 868.63多年平均流量/(m3s-1)71.4839.292.2研究方法本文通过水文法计算流域断面最小生态流量核算值,再利用熵值法确定各模型输入因子权重,最后建立基于LSTM深度学习的河湖生态流量预警预报模型。其中,LSTM模型输入为熵值法权重分配后的历史降雨、蒸发及水库调度数据,输出则为断面河湖生态流量预报值。模型预见期为1天,通过生态流量预报结果结合预警等级阈值,呈现断面预警信息。2.2.1最小生态流量核算值计算方法目前,计算生态流量的方法很多,大致可分为水文法、水力-栖息地法和整体法三大类11。水文法具有计算简单、操作方便等优点,因此本研究以柏枝岙和沙段水文站多年日流量为依据,采用水文法中的Q90法、最枯月平均流量法和流量历时曲线法作为流域控制断面生态流量计算方法。2.2.2熵值法熵值法基本思想是根据变量来确定权重,并在水文和水资源领域中得到了广泛应用;一般来说,熵值提供的信息量越大,在整体评价中的权重越大12。为了客观确定预报因子的权重,我们首先需要消除预报因子之间不同维度的影响,在n个待评价预报因子的基础上,选择各个待评价预报因子的m个数据,采用均值法对原始数据进行标准化:xij=xij/-xi()i=1,2,m;j=1,2,n(1)式中:-xi为第i项预报因子的均值;i和j分别表示为第i和第j个预报因子。熵和熵的权重可以由如下公式确定:Hi=-kj=1nfijlnfij(2)66王贝等:基于LSTM深度学习的河湖生态流量预警预报模型研究第3期式中:Hi为第i项预报因子的熵,fij=xij/j=1nxij,k=1/lnn。我们假设当fij为 0 时,fijlnfij为 0,然后利用式(3)计算各预报因子的权重:wi=1-Hii=1m()1-Hi,0wi1,i=1mwi=1(3)式中:wi为预报因子的权重;Hi含义同式(2)。2.2.3新安江模型新安江模型是一种概念性水文模型13,已被广泛用于中国湿润和半湿润地区的洪水预报。集总式新安江模型由四层结构组成,包括蒸散发部分、产流部分、水源划分部分和汇流部分。本文采用三水源新安江模型,结合经验选取和粒子群寻优算法,求得模型各参数值。2.2.4长短期记忆神经网络(LSTM)本文中LSTM模型的结构如图2所示。长短期记忆神经网络(Long Short-Term Memory,LSTM)是循环神经网络(Recurrent Neural Network,RNN)的变种,其能够有效地解决 RNN 长期记忆能力不足的问题14。在LSTM中,细胞中信息的添加或删除由三种门控制,即遗忘门、输入门和输出门,它们用于控制单元内的信息流。遗忘门控制要从上一个单元格状态中删除的信息量,要引入单元状态的信息则由输入门控制,生成可附加到单元状态的候选层的向量,根据前面两个步骤将旧单元状态调整为新单元状态,输出门向用作输出的单元状态中选择信息15。实测降水It-1Ht-2Ct-2Ct-1Ct+1CtHt-1Ht-1HtHtHt+1Ht+1It+1IttanhtanhtanhtanhtanhtanhIIIIIIIIIIIIIIIII实测蒸水河湖生态流量河湖生态流量预警信息输入输出历史水利工程调度信息图2LSTM模型结构图Fig.2Structure diagram of LSTM model2.2.5评价指标本文设置纳什效率系数(NSE)和百分比偏差(Bias%)为模型预报性能评价指标,其中NSE越接近1表示预测效果越好,Bias%越接近0表示预测效果越好。其公式如下所示:NSE=1-i=1n()Qobsi-Qesti2i=1n()Qobsi-Qobsi2(4)Bias%=100i=1nQesti-i=1nQobsii=1nQobsi(5)式中:Qobsi为日径流观测值;Qesti为模型预测值;-Qobsi为观测值的平均值;n为数据总数。根据 水文情报预报规范(GBT 2248222008),当生态流量预警预报结果与实际发生结果相同时,判定为合格预报,并将合格预报次数与预报总次数之比的百分数为合格率,表示多次预报总体的精度水平。合格率计算公式如下所示:FR=nm100%(6)式中:FR 为合格率;n为合格预报次数;m为预报总次数。预报项目的精度按合格率的大小分为甲、乙、丙三个等级。方案精度达到甲(FR85.0)、乙(85.0FR70.0)两个等级者,可用于正式预报;方案精度达到丙(70.0FR60.0)等者可用于参考性预报;方案精度达到丙等以下者,只能用于参考性估报。3结果与分析3.1河湖生态流量核算值及保证率计算3.1.1河湖生态流量核算值计算选取19912020年椒江流域生态流量控制断面(柏枝岙和沙段)的最枯月平均流量,利用Q 90法、最枯月平均流量法和流量历时曲线法等三种方法计算得出的椒江流域两个控制断面的生态流量核算值如表2所示。表2各计算方法得出的控制断面生态流量核算值Table2Ecological flow accounting value of control stationsobtained by different calculation method计算方法Q90法最枯月平均流量法流量历时曲线法柏枝岙生态流量核算值/(m3s-1)2.899.1642.53沙段生态流量核算值/(m3s-1)1.926.9222.58Q 90 法所得柏枝岙和沙段断面生态流量核算值小于其多年平均流量的10%(7.15m3/s和3.93m3/s),67第43卷水 文其它两种方法结果远大于其多年平均流量的10%,根据 Tennant 法生态流量标准中多年流量的 10%对应中等河道内生态环境状况,并结合椒江流域自身河道水生态环境状况,Q 90法计算结果较为合理可靠 并 符 合 实 际 情 况,故 本 研 究 选 取 2.89 m3/s 和1.92 m3/s分别作为柏枝岙和沙段断面的最小生态流量核定值。3.1.2河湖生态流量保证率计算根据柏枝岙和沙段断面的生态流量核定值,对19912020年的生态流量保证率进行评估。由图3可见,椒江流域柏枝岙断面各年的生态流量保证率要高于沙段断面。结合流域内水库控运计划可知,柏枝岙上游下岸水库和沙段上游里石门水库有明确生态流量排放标准,但是其余中小型水库的调度运行尚未考虑生态流量要求,且流域上下游生态流量联合调度、监管体系尚未建立。3.2河湖生态流量预警设置根据水总研二2019328号文件关于生态流量预警等级的确定,将生态流量预警等级分为3级,按生态基流目标要求值的120%110%、110%100%和小于 100%设置蓝色、黄色和红色预警,具体如表3 所示。表3控制断面生态流量预警值设置Table3Setting of ecological flow early warning value of controlstations生态流量预警等级无预警蓝色预警黄色预警红色预警柏枝岙生态流量/(m3s-1)Q3.463.46Q3.173.17Q2.88QQ2.092.09Q1.90Q1.90当控制断面生态流量预警等级为无预警时,可以保证永安溪和始丰溪河流生态系统健康,无需进行生态流量调度;出现蓝色预警时,密切监视旱情发展趋势,关注控制断面以上农业生产用水大户取用水情况,加密断面的流量监测;出现黄色预警时,做好柏枝岙断面上游水库(下岸水库和里林水库)和沙段断面上游水库(里石门水库和龙溪水库)补水工作,加大下泄流量;出现红色预警时,上游地区保证生活用水,进一步压减农业用水,同时加大枝岙断面上游水库(下岸水库和里林水库)和沙段断面上游水库(里石门水库和龙溪水库)补水,机组满负荷运行且强化与上游小型水库的联合运用,努力保障断面生态流量。3.3河湖生态流量预报预警模型结果首先采用熵值法,对模型预报因子进行权重赋值,选取历史日尺度降雨、蒸发、水库出库流量数据作为预报模型输入因子,具体权重见表4。表4预报模型各输入因子权重Table4Weight value of each input factor of prediction model模型输入因子降雨(P)蒸发(E)下岸/里石门水库出库流量(S1)里林/龙溪水库出库流量(S2)权重值/柏枝岙0.510.050.260.18权重值/沙段0.430.080.230.26根据熵值法求得的各预报模型输入因子的权重,通过分析降雨(P)、蒸发(E)和上游水库出库流量(S1和S2)与断面生态流量(Qt)的互相关关系对LSTM模型的输入因子进行分配。对于权重值最大的降雨选用 相 关 关 系 较 强 的 7 个 输 入 因 子,分 别 为:Pt-1、Pt-2、Pt-3、Pt-4、Pt-5、Pt-6、Pt-7;对于权重值最小的蒸发选用相关关系较强的3个输入因子,分别为:Et-1、Et-2、Et-3;对于权重值居中的两个水库出库流量各选取相关关系较强的5个输入因子,分别为:S1t-1、图3控制断面生态流量保证率变化过程Fig.3Change process of ecological flow assurancerate of control stations100.0098.0096.0094.0092.0090.0088.0086.0084.0082.0080.001985 19901995 2000(a)柏枝岙生态流量保证率/%2005 20102015 202020251985 19901995 2000(b)沙段2005 20102015 20202025100.0098.0096.0094.0092.0090.0088.0086.0084.0082.0080.00生态流量保证率/%68王贝等:基于LSTM深度学习的河湖生态流量预警预报模型研究第3期S1t-2、S1t-3、S1t-4、S1t-5、S1t-1、S1t-2、S1t-3、S1t-4、S1t-5,其中t的单位为日。LSTM模型的输出因子Qt,Qt为椒江流域沙段和柏枝岙断面生态流量值,且模型预见期为1 天。预报模型取 20112017 年为率定期,20182019年为验证期。本方案中所采用的LSTM模型中,主要涉及的参数设置如下:隐藏层层数(lstm_layers)设置为2,隐藏层内神经元数量(rnn_unit)取值为 30,训练学习率(lr)设定为0.0001,Dropout参数设置为0.1,批量处理参数(batch_size)为60、最大训练代数设为1 000。根据上述LSTM模型参数,得到椒江流域柏枝岙和沙段断面模拟流量结果。LSTM 模型验证期纳什效率系 数分别为 0.91 和 0.88,高于新安江模型的 0.88和 0.86。与此同时,LSTM 模型模拟的百分比偏差(2.55%和-3.22%)远低于新安江模型模拟结果(-8.25%和6.02%),说明本方法中LSTM模型的模拟效果要优于新安江模型,可用于该流域断面水文站点的生态流量预报。本方法将 LSTM 模型预报的生态流量根据柏枝岙和沙段断面生态流量预警等级在程序中自动转化成对应的预警信息,再对不同预报预警等级结果进行验证,具体结果见表 5。柏枝岙断面各合格率均超过90%,但是沙段断面合格率略低于柏枝岙断面,但是总体百分比均超过 80%,说明本方案模型具有较高的预报精度,可用于实际生态流量管理和调度中。表5LSTM模型预报合格率分析Table5Analysis of prediction qualified rate of LSTM model生态流量预警等级无预警有预警蓝色预警黄色预警红色预警柏枝岙合格率/%98.7210096.6791.4392.31沙段合格率/%95.3896.6185.9683.7888.394结论(1)Q 90法计算的断面生态流量核算数值较小更为保守,而最枯月平均流量法和流量历时曲线法的计算结果远大于其多年平均流量的10%,结合椒江流域自身河道水生态环境状况,Q 90法计算结果较为合理可靠并符合实际情况。(2)采用熵值法对降雨、蒸发、水库出库流量数据等模型预报因子进行权重赋值,发现两个断面结果基本一致,降雨所占权重值最大,其次为水库出库流量,蒸发的权重值则为最小。(3)LSTM模型对径流的模拟能力要优于传统新安江模型,且基于LSTM深度学习的生态流量预警预报模型的合格率均90%以上,说明本方案模型可以很好地完成河湖生态流量预警信息预报任务。参考文献:1 孙翀,王猛,张建永,等.我国重要河湖生态流量保障现状及问题分析J.水利规划与设计,2021,3(2):4-7,28.2 CHENG B,LI H.A Bayesian network approach for determining optimal ecological base flow of rivers in water shortage areas of NorthwestChina J.Environmental Science and Pollution Research,2021,28:37768-37780.3 CHENG B,LI H,YUE S,et al.A conceptual decision-making for theecological base flow of rivers considering the economic value of ecosystem services of rivers in water shortage area of Northwest China J.Journal of Hydrology,2019,578.4 于守兵,凡姚申,余欣,等.黄河河口生态需水研究进展与展望J.水利学报,2021,51(9):1101-1110.5 高雪山,关帅,刘树锋,等.基于生态保护目标的武江流域生态流量定值研究J.水文,2020,40(5):1-6.6 李斐,邓志民,邓瑞,等.汉江干流生态流量保障措施研究J.人民长江,2021,52(2):50-54.7 江善虎,周乐,任立良,等.基于生态流量阈值的河流水文健康演变定量归因J.水科学进展,2021,32(3):356-365.8 FU Y,LENG J,ZHAO J,et al.Quantitative calculation and optimizedapplications of ecological flow based on nature-based solutions J.Journal of Hydrology,2021,598:126216.9 HSU N S,CHIANG C H,CHENG W M,et al.Study on the Trade-Offbetween Ecological Base Flow and Optimized Water Supply J.WaterResources Management,2012,26:3095-3112.10黄克威,王根绪,宋春林,等.基于LSTM 的青藏高原冻土区典型小流域径流模拟及预测J.冰川冻土,2021,43(4):1144-1156.11肖卫,周刚炎.三种生态流量计算方法适应性分析及选择J.水利水电快报,2020,41(12):59-62.12SREEPRVATHY V,SRINIVAS V.A fuzzy entropy approach for design of hydrometric monitoring networks J.Journal of Hydrology,2020,586.13赵人俊.流域水文模拟-新安江模型和陕北模型M.北京:水利电力出版社,1984.14郭玉雪,许月萍,陈浩,等.基于多种递归神经网络的海岛水库径流预报J.水力发电学报,2021,40(9):14-26.15AN L,HAO Y,YEH T C J,et al.Simulation of karst spring discharge using a combination of time-frequency analysis methods andlong short-term memory neural networks J.Journal of Hydrology,2020,589.69第43卷水 文Study on Early Warning and Forecasting Model of Ecological Flow inRivers and Lakes Based on LSTM Deep LearningWANG Bei1,CHEN Hao2,3,HE Xijun1,XU Yueping2,GUO Yuxue2,GENG Fang4,WANG Chong4(1.Zhejiang Hydrological Management Center,Hangzhou310009,China;2.Civil Engineering and Architecture,ZhejiangUniversity,Hangzhou310058,China;3.College of Hydraulic and Environmental Engineering,Zhejiang University of WaterResources and Electric Power,Hangzhou310018,China;4.Zhejiang Hydrographic Technology Development and OperationCompany,Hangzhou31009,China)Abstract:In order to explore the prediction and warning mechanism of river and lake ecological flow,and to improve the ecological environment of rivers and lakes,this study used Jiaojiang River basin in Zhejiang Province as the research area,and a newecological flow forecasting method combining entropy method and LSTM considering warning information was presented.The results showed that the ecological flow accounting values of Baizhiao and Shaduan stations obtained by the Q90 method are 2.89 m3/sand 1.92 m3/s respectively,and the calculation results are less than 10%of the annual average flow,which are more reasonableand reliable.The Nash efficiency coefficients in the validation period of the model are 0.91 and 0.88 respectively,and the percentage deviation are 2.55%and-3.22%,indicating that it has better performance of the low flow simulation than the Xinanjiangmodel.The qualified rate of prediction without warning information are 98.72%and 95.38%,and the qualified rate of predictionwith warning information are as high as 100%and 96.61%,which meets the first division accuracy of prediction,indicating thatthis method can well complete the task of river and lake ecological flow warning information prediction.Keywords:ecological flow;entropy method;LSTM;Jiaojiang River basin16SAHOO A K,UDGATA S K.A novel ANN-based adaptive ultrasonicmeasurement system for accurate water level monitoringJ.IEEETransactions on Instrumentation and Measurement,2019,69(6):3359-3369.17BREIMANL.RandomforestsJ.Machinelearning,2001,45(1):5-32.18田菊飞,苏怀智.基于随机森林算法的大坝应力预测模型的构建及其应用J.水电能源科学,2018,36(5):54-56.19闫聪,林斯杰,邓泽政,等.一种基于污染风险的地下水监测井网多目标优化方法J.安全与环境工程,2021,28(3):240-248.20AVILA R,HORN B,MORIARTY E,et al.Evaluating statistical model performance in water quality predictionJ.Journal of environmental management,2018,206:910-919.21张洪强,刘光远,赖祥伟.随机森林算法在肌电的重要特征选择中的应用J.计算机科学,2013,40(1):200-202.Research on Groundwater Quality Assessment of Mihe-WeiheRiver Basin Based on Random Forest AlgorithmLIN Yanzhu1,HAN Zhong2,HUANG Linxian3,4,XING Liting3,4,LIANG Hao5,HOU Jinxiao3(1.China Geological Environment Monitoring Institute(Geological Disaster Technical Guidance Center),Beijing100081,China;2.Institution of Geology and Mineral Resources Exploration of Shandong Province,Weihai264209,China;3.School of Water Conservancy and Environment,University of Jinan,Jinan250022,China;4.Engineering Technology Institute for Groundwater Numerical Simulation and Contamination Control,Jinan250022,China;5.Shandong Provincial Space Ecological Restoration Center,Jinan250014,China)Abstract:Accurately assessment of groundwater quality is an prerequisite for effective exploitation and protection of groundwaterresources.A groundwater quality assessment model for the Mihe-Weihe River basin was constructed based on random forest algorithm.The results show that,(1)random forest algorithm has high accuracy and strong generalization ability for groundwater quality classfication;moreover,after hyperparameter optimization,its classification accuracy will be further improved,which shows thatthe random forest based model is excellently suited for groundwater quality assessment,and its comprehensive performance is better than the logistic regression model;(2)the groundwater samples are all classified as Class IV and V,indicating poor groundwater quality;(3)the importance of classification indicators show that the main influencing indicators of groundwater quality in thisstudy area are nitrate,total hardness and total dissolved solids,and the main sources of such indicators are from unreasonableuse of fertilizers and infiltration of river pollution.Therefore,it is necessary to further strengthen the monitoring and control of pollution emissions from vegetable planting and river water quality.Keywords:machine learning;random forest algorithm;Mihe-Weihe River basin;groundwater quality assessment(上接第64页)70