温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
大坝
变形
GA
LSTM
组合
预测
模型
研究
刘丹
文章编号:1009-6094(2023)07-2246-08大坝变形 GALSTM 组合预测模型研究*刘丹1,2,吕倩1,2,胡少华2,3,李墨潇1,2(1 武汉理工大学中国应急管理研究中心,武汉 430070;2 武汉理工大学安全科学与应急管理学院,武汉 430070;3 国家大坝安全工程技术研究中心,武汉 430010)摘要:为监测大坝运行过程中的异常状态,防范化解大坝溃坝等重大风险,基于大坝变形大样本、非线性监测数据,引入长短期记忆(Long Short Term Memory,LSTM)神经网络模型对大坝变形趋势进行预测,以测试样本的均方根误差最小为适应度函数,采用遗传算法(Genetic Algorithm,GA)优化LSTM 模型参数,建立大坝变形 GA LSTM 组合预测模型。以福建水口水电站大坝为例进行验证分析,并与 LSTM 模型和门控循环神经网络(Gated ecurrent Unit,GU)模型预测结果进行对比分析。分析结果表明,GA LSTM 模型的预测效果和性能更佳,且相较于 LSTM 模型和 GU 模型各测点预测误差均有减小,平均绝对误差减小量最高达 6.92%。关键词:安全工程;大坝变形;长短期记忆神经网络;遗传算法;预测性能;参数优化中图分类号:X959文献标志码:ADOI:10.13637/j issn 1009-6094.2022.0516*收稿日期:2022 03 27作者简介:刘丹,副教授,博士,从事风险监测预警、大数据与机器学习、复杂系统建模与仿真研究,liudan8575 whut edu cn;李墨潇(通信作者),讲师,博士,从事基础设施安全,岩土力学研究,lmx whut edu cn。基金项目:国家大坝安全工程技术研究中心开放基金项目(CX2019B04);国 家 自 然 科 学 基 金 项 目(51979208);国家“十三五”重点研发计划重点专项项目(2017YFC0804608)0引言我国目前水库大坝数量为 9.8 万余座,位居世界首位。大坝安全极其重要,一旦发生溃坝,将造成难以估量的巨大损失。如 1975 年,河南省驻马店水库溃坝,造成 1 100 万人受灾,102 km 京广线被冲垮,直接经济损失近百亿元;2018 年,肯尼亚纳库鲁郡水坝溃坝,造成 48 人死亡。大坝安全监测是大坝安全管理的重要内容,其监测项目主要包括变形、应力应变、渗流、环境量等1。中华人民共和国国民经济和社会发展第十四个五年规划和 2035 年远景目标纲要 强调“保障国家水安全,加强水安全监测预警和风险防范能力”。对大坝进行安全监测、及时发现异常隐患具有重要意义。国内外学者在大坝变形预测方面开展了大量研究。1956 年,Tonini2 首先建立了统计模型,奠定了现代分析影响大坝变形的环境效应量的基础。吴中如等3 4 提出了混凝土坝变形统计模型中的水压、温度、时效和裂缝因子选择的基本理论,并建立了混凝土坝位移确定性模型和混合模型。1998 年,吴中如等5 对河海大学开展的数学监控模型、参数和边界条件反分析、拟定变形监控指标及大坝安全综合评价专家系统等方面的理论、方法及其应用进行了总结阐述。2003 年,顾冲时等6 采用三维薄层有限元和数值模型分析方法,对电站坝段裂缝的产生和扩展、坝体向上游变形的原因做了深入研究。随着数据驱动研究范式的兴起和人工智能技术的广泛应用,学者们开始了基于支持向量机模型(Support Vector Machines,SVM)的大坝变形研究。钱秋培等7 验证了 SVM 对混凝土坝变形的预测能力。Su 等8 结合粒子群算法与 SVM 模型预测大坝变形,研究大坝变形动力模型。随后,学者们将神经网络技术应用于大坝变形预测研究。季威等9 基于反向传播(Back Propagation,BP)神经网络提出大坝位移预测多测点模型,在对缺失值补全后对目标测点进行位移预测。Dai 等10 提出了基于改进人工鱼群算法和 BP 神经网络的大坝变形预测模型。BP 神经网络模型虽能够较好地解决复杂的非线性问题,但易陷入局部极值。长短时记忆网络(Long ShortTerm Memory,LSTM)神经网络模型能够充分利用历史数据进行预测研究,在非线性具有时间序列的数据、多输入单输出问题预测研究上展现突出优势,并已开始应用于水质11、滑坡12 等领域。大坝变形受多个因素的影响,历史监测数据较多,且具有较强的非线性特点,适合应用 LSTM 模型。然而,现有研究在 LSTM 模型参数设置上主要选用控制变量调参、网格搜索算法,参数组合方式较多,计算量大且耗时较长。如王子凡等13 使用网格搜索方法对LSTM 网络超参数进行寻优。考虑到大坝变形特点,仅使用单一的 LSTM 模型进行变形预测具有一定的局限性,因此可考虑组合模型14 15 的应用。鉴于此,本文基于 LSTM 模型对大坝变形进行预测研究,引入遗传算法(Genetic Algorithm,GA)对LSTM 模型参数进行优化处理,将大坝变形环境量和效应量作为输入变量,以测试值误差最小为目标,建6422第 23 卷第 7 期2023 年 7 月安全 与 环 境 学 报Journal of Safety and EnvironmentVol 23No 7Jul,2023立 GA LSTM 组合预测模型,并结合工程实例进行变形预测。1模型构建1.1影响因素分析大坝变形效应量主要受上下游水位差即水压、温度及时间效应等因素影响16。大坝主要可分为混凝土坝和土石坝两种类型,目前坝工设计中的主流为混凝土坝,而主流中的主流是混凝土重力坝,三峡大坝等重大水利工程均为混凝土重力坝。以混凝土坝为例,在对大坝变形进行预测时主要考虑水压分量、温度分量和时效分量。其模型的一般表达式如下。y(t)=yH(t)+yT(t)+y(t)(1)式中y(t)为监测效应量 y 在时刻 t 的统计估计值;yH(t)为 y(t)的水压分量;yT(t)为 y(t)的温度分量;y(t)为 y(t)的时效分量。1)水压分量16。大坝受水压影响产生的变形量主要与水深的幂次方相关,对一般重力坝常取 H、H2、H3,对拱坝、连拱坝常取 H、H2、H3、H4。水压分量可表示为yH(t)=f H,H2,H3或 yH(t)=f H,H2,H3,H4(2)2)温度分量16。坝体相对稳定,采用周期项模拟坝体温度场变化,取 sin(2t/365)、cos(2t/365)、sin(4t/365)和cos(4t/365)这 4 个影响因子,即温度分量可表示为yT(t)=f sin(2t/365),cos(2t/365),sin(4t/365),cos(4t/365)(3)3)时效分量16。时效因子采取 和 ln 为相对于基准日期的时间计算参 数,取 =(观 测 日 序 号 基 准 日 序号)/365。y(t)=f,ln(4)综上,模型的输入为大坝变形历史监测数据与影响大坝变形的环境因子,而重力坝变形环境影响因 子 主 要 包 括H、H2、H3、sin(2t/365)、cos(2t/365)、sin(4t/365)、cos(4t/365)、和ln。1.2大坝变形组合预测模型1.2.1LSTMLSTM 模型由 Hochreiter 等17 于 1997 年首次提出,是 一 种 对 递 归 神 经 网 络(ecursive NeuralNetwork,NN)模型的改进,采用记忆细胞的特殊单元来替换隐藏层中的传统神经元,记住需要的信息并遗忘不需要的信息,并结合输入门、输出门和遗忘门 3 种门控结构,以解决 NN 训练过程中出现的梯度爆炸和梯度消失问题,内部结构见图 1。ht为 t 时刻的隐藏状态;h 为隐藏单元个数;和 tanh 为激活函数;it、ot、ft分别为 t 时刻的输入、输出和遗忘信息;Ct为 t 时刻的记忆细胞18。图 1LSTM 单元结构图Fig 1Structure diagram of LSTM unitLSTM 模型中的每个记忆细胞都具有输入门、输出门和遗忘门。输入门决定当前阶段输入的新信息的概率,即对新的输入强度进行控制。由激活函数sigmoid 层和 tanh 层共同控制新信息的输入。输出门控制当前状态对下一状态可见的信息量,对内部隐藏的状态信息进行隐藏,从而产生新的隐藏层。遗忘门中前一阶段的隐藏层输出和当前阶段的输入分别乘以权重,与前一阶段记忆细胞的状态经过激活得出前一阶段记忆细胞留下的记忆量,即对历史信息进行取舍,如果遗忘门全关,即遗忘门输出 ft各元素为 0,则历史对当前状态无影响。各门函数计算公式如下。it=(Wi(Xt,ht1)+bi)(5)ot=(Wo(Xt,ht1)+bo)(6)ft=(Wf(Xt,ht1)+bf)(7)式中Xt为 t 时刻输入的样本数据;Wi、Wo、Wf分别为 sigmoid 层、输出门和遗忘门 t 时刻的权重参数;bi、bo、bf分别表示 sigmoid 层、输出门和遗忘门的偏置向量。t 时刻的候选记忆细胞 Ct由上一时刻的隐含状态决定,而 t 时刻的记忆细胞通过输入门和遗忘门来确定18,即Ct=tanh(Wc(Xt,ht1)+bc)(8)Ct=ft Ct1+it Ct(9)式中bc为 tanh 层的偏置项;Wc为 tanh 层的偏置参数;表示矩阵乘法。t 时刻的隐藏状态由输出门和记忆细胞通过74222023 年 7 月刘丹,等:大坝变形 GA LSTM 组合预测模型研究Jul,2023tanh 层决定。即ht=ottanh Ct(10)1.2.2GA LSTM 大坝变形预测模型遗传算法是模仿自然界生物进化机制发展起来的随机全局搜索和优化方法,借鉴了达尔文的进化论和孟德尔的遗传学说,是一种高效、并行、全局搜索的方法,能在搜索过程中自动获取和积累有关搜索空间的知识,并自适应地控制搜索过程以求得最佳解。遗传算法将种群作为问题的解,通过选择、交叉、变异操作,生成新的种群,其判断准则是适应度函数,在搜索循环的过程中逐渐趋向适应度最优的种群,即得问题的解。其处理流程示意图见图 2。图 3GALSTM 大坝变形预测模型流程图Fig 3Flow chart of GALSTM prediction model of dam deformation采用遗传算法对 LSTM 模型的 LSTM 层、全连接层及各层神经元个数进行参数寻优,以测试数据的均方根误差作为适应度函数,以获得搜索空间内的最优解,需要优化的参数见表1。GA LSTM 大坝变形预测模型见图 3,具体步骤如下。步骤 1:数据获取,对监测数据进行处理,筛选数据并补充缺失值。步骤 2:输入监测数据,将影响大坝变形的环境因子和历史监测效应量数据作为输入变量,以大坝变形监测数据作为输出变量。步骤3:初始化遗传算法参数设置,设置 DNA 长度,染色体长度、种群数量、交叉率、变异率及迭代次数。步骤 4:随机生成 N 个种群,经过交叉、变异,计算适应度,选出每一代中适应度值最优的解。步骤 5:生成新的种群,进行下一次迭代,直到迭代次数达到最大值时停止,将所得到的最优解作为 LSTM 模型的层数及各层神经元个数。图 2遗传算法流程图Fig 2Flow chart of genetic algorithm8422Vol 23No 7安全 与 环 境 学 报第 23 卷第 7 期步骤 6:训练得到 GA LSTM 大坝变形预测模型。1.3评价指标采用拟合优度 2、平均绝对误差 EMA和均方差EMS三种评价指标对模型性能进行综合评价。拟合优度计算公式为2=1 i(yi yi)i(yi yi)(11)平均绝对误差计算公式为EMA=1NNi=1yi yi(12)均方根误差计算公式为EMS1NNi=1(yi yi)槡2(13)式中yi表示监测数据,yi表示预测值,N 表示数据样本量。2实例分析2.1工程概况水口水电站是我国华东地区装机、库容规模最大的水电站,位于福建省闽清县境内闽江干流上,工程等级为等大工程。电站坝址以上集水面积为52 438