温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
LSTM
网络
汽轮机
转子
应力
预测
方法
杨晨
收稿日期:20210401修回日期:20210427第 40 卷第 2 期计算机仿真2023 年 2 月文章编号:10069348(2023)02012305基于 LSTM 网络的汽轮机转子热应力预测方法杨晨,柴京,张涛,王晓升(重庆大学能源与动力工程学院,重庆 400044)摘要:在电厂灵活运行期间,转子内部因温度梯度较大而产生热应力,导致转子疲劳损伤。而传统有限元分析热应力的方法无法满足实时监测的需求。研究了一种基于数据驱动的 LSTM 神经网络模型。模型具有从历史序列数据中学习深度信息的能力。通过多组超参数对比实验,发现在神经元数量 6,单元节点 28,学习率 0.005,Dropout 比例 0.5 时网络预测效果较好;在冷态启动过程下使用 LSTM 神经网络模型的热应力预测数据与有限元样本数据相比,MSE 为 7.8740MPa,最大热应力误差 9.7480MPa。结果表明,上述模型相比传统有限元计算时间大大缩短,在保证较高精度同时,也能够满足未来实时在线监测的需要。关键词:汽轮机转子;热应力;长短期记忆;超参数中图分类号:TP183文献标识码:BPrediction Method of Steam Turbine otor Thermal StressBased on LongShortTerm Memory NetworkYANG Chen,CHAI Jing,ZHANG Tao,WANG Xiaosheng(School of Energy and Power Engineering,Chong Qing University,Chongqing 400044,China)ABSTACT:During the flexible operation of the power plant,thermal stress is generated in the rotor due to the largetemperature gradient,which leads to the fatigue damage of the rotor This paper studiesd a datadriven LSTM neuralnetwork model,which can automatically learn features from historical data Through a number of superparametric ex-periments,it is was found that the network prediction effect is better when the number of neurons is 6,the number ofunit nodes is 28,the learning rate is 0005,and the dropout ratio is 05 Compared with the finite element sample da-ta,the MSE of LSTM neural network model is 78740mpa,and the maximum thermal stress error is 97480mpaThe results show that the calculation time of the model is greatly shortened compared with the traditional finite ele-ment method,which can ensure high accuracy and meet the needs of realtime online monitoring in the futureKEYWODS:Steam turbine rotor;Thermal stress;Long and shortterm memory;Hyperparameter1引言随着可再生能源的发展,传统的燃煤电厂将承担更多的调峰任务,这对电厂的灵活运行提出了更高的要求1。在机组快速启动或突然的变负荷过程中,局部过热的部位可能会出现较大的温度梯度,从而导致有害的热应力。因此,在传统的燃煤电厂中,汽轮机转子危险部位热应力的监测对于机组的安全运行至关重要。一直以来,国内外关于热应力研究都是通过理论计算来解决,一种基于导热微分方程的解析法;一种采用数值仿真方法求解转子温度场和热应力场2。近年来,随着深度学习技术的不断发展,许多学者提出了一种基于数据利用深度学习技术来建模的方法,目的是寻找输入特征数据与输出变量之间最佳映射关系。这种数据驱动的方法能够充分利用历史数据并且降低计算时间及成本,为热应力的监测提供了新的研究思路3。许多研究人员已经应用机器学习技术来预测燃煤电厂中难以直接测量的重要运行参数4。Shi5 等使用超临界燃煤锅炉的运行数据训练了两个神经网络模型(NN),一个用来预测 NOX 排放,另一个用来预测锅炉的热效率,然后将两个模型用于优化 NOX的排放和热效率。Li6 等人使用极限学习机器(ELM)的框架和改进的蚁群优化算法对 300MW 燃煤锅炉的各种运行变量和热效率之间的关系进行训练。Lv7 等使用最小二乘支持向量机(LSSVM)模型来拟合和321预测燃煤循环流化床锅炉的瞬态温度,输入按照时间顺序依次递推。Tan8 等人使用递归神经网络(NN)来预测锅炉下一时间步的 NOX值。Tang9 等人使用 LSTM 神经网络来预测船用蒸汽轮机转子的应力,输入采用滑动时间窗形式来实现多对一的序列数据预测。从国内外的研究现状中可以看出,学者利用历史数据、传统技术(有限元)得到的特征数据作为样本,基于机器学习技术(向量机(SVM)、神经网络等)建立输入与输出的映射关系,得到难以测量的重要参数的预测值10 20 7。本文基于 LSTM 循环神经网络建立了一种汽轮机转子热应力的预测模型。对比不同超参数、不同 Dropout 比例下LSTM 模型与有限元计算结果,验证所建立模型的有效性及合理性。2LSTM 循环神经网络LSTM 神经网络是循环神经网络 NN 的一种改进架构,由 Schmidhuber 于 1997 年首次提出。而 LSTM 则已经可以成功的解决传统 NN 中存在的问题,并且还可以有效的用于预测长时信息。LSTM 是一种特殊的 NN,可对时序序列数据进行建模。NN 之所以称为循环神经网络,是因为序列的当前输出还与先前的输出有关,即隐藏层在神经元之间具有连接,并且网络的结构就像一条链。其结构如图 1 所示。NN 可以看作是在时间轴上传递的神经网络,其深度是时间的长度。NN 将最后一刻的隐藏层输出作为计算过程的输入。但是,如果网络深度越长,则后一个时间节点对前一个时间节点的学习能力将随着时间步长逐渐降低,即“消失梯度”。图 1NN 单元结构为了解决 NN 在运行过程中的消失梯度问题,LSTM 在原有 NN 网络结构的基础上,用 LSTM 单元代替了隐藏层的NN 单元,并重置计算节点。隐藏层在 NN 的基础上增加了自连接的存储和乘法单元,为神经网络提供读写和判断功能。LSTM 隐藏层的单元结构如图 2 所示。LSTM 在隐藏层中的单元结构包含称为内存块的特殊单元,用于长时间存储信息。此外,在每个 LSTM 单元中加入了三个门控结构,即输入门、遗忘门和输出门,以形成一个新的计算单元20。输入门控制信息输入,遗忘门控制计算单图 2LSTM 单元结构元的历史状态信息的保留,输出门控制信息输出。该过程可用以下公式表示:输入门it=(Wixt+Uiht1+Vict1+bi)(1)遗忘门ft=(Wfxt+Ufht1+Vfct1+bf)(2)记忆细胞ct=ft ct1+it tanh(Wcxt+Ucht1+bc)(3)输出门ot=(Woxt+Uoht1+Voct+bo)(4)输出ht=ot tanh(ct)(5)其中:ct代表单元在 t 时刻的长期记忆状态;ht代表 t 时刻的短期记忆状态;W、U、V 分别代表输入门、遗忘门、输出门权重矩阵;b 代表偏执向量;(elementwise multiplication)代表同位元素对应相乘;()、tanh()代表激活函数(x)=11+ex(6)tanh(x)=ex exex+ex(7)3LSTM 循环神经网络汽轮机转子热应力预测模型3.1模型结构本文设计的网络的基本框架包括 1 层 LSTM、1 层Dropout、1 层 Dense 全连接网,结构如图 3 所示。LSTM 神经网络是将输入的特征进行记忆和筛选,并进行拟合预测,最后通过全连接层输出预测结果。LSTM 的输入即为样本输入序列,LSTM 的隐藏层循环神经元的数量为时间步长。全连接层可以增强模型的非线性表达能力。在深层神经网络中,因其参数量大,容易发生过拟合的现象,而 Dropout 技术就是一种常用的防止过拟合技术,即在训练中以一定的比例随机让一些神经元失活,不会向前传递信息。Dense 层将多个神经元的结果作为输入进行加权输出,从而计算出预测数据。3.2损失函数和优化算法损失函数是计算神经网络输出值与实际值之间偏差的421图 3LSTM 网络结构函数,用来衡量模型预测的准确性,目的就是使得总体损失函数值之和最小。本模型的损失函数选择 MSE 和 MAPE,它在接近收敛点处的梯度会慢慢变小,利于收敛。定义如下:均方根误差(标准误差)MSEMSE=1nni=1 yi f(xi)2(8)平均绝对百分比误差 MAPEMAPE=1nni=1|yi f(xi)|yi 100%(9)式中:yi为样本期望值,f(xi)为样本预测值。LSTM 网络的训练过程采用 Adam 优化器。优化的核心是获得可以通过迭代使目标函数最小化的模型参数。Adam结合了自适应梯度(AdaGrad)和 MSProp 的优点,更新的步长由梯度的第一矩估计(梯度的平均值)和第二矩估计(无中心梯度的方差)得到。Adam 优化器本质上是时间反向传播 BPTT 的一种实现方法。Adam 优化算法的公式为mt=1mt1+(1 1)Lvt=2mt1+(1 2)(L)2(10)式中:mt为梯度第一矩估计;1、2为超参数;vt为第二矩估计。为了使参数能正常更新,需做如下的偏差修正mt=mt1 t1vt=vt1 t2(11)式中:mt、vt为修正的第一、第二矩估计。Adam 算法对神经网络参数进行更新的公式如下t1=tmtvt+(12)式中:为神经网络模型的学习率;为防止除零误差常数。3.3数据样本标准化处理样本输入特征数据来源于冷态启动曲线,原始数据如图4 所示。应用有限元计算转子热应力涉及的相关参数包括蒸汽压力、蒸汽温度、转子表面换热系数、转子转速。热应力值是随着启动时间在不断变化,相邻时刻的样本之间存在一定的联系。为了让神经网络获取输入特征和输出值之间的关系,设计 LSTM 神经网络输入特征向量为 7,特征量分别是蒸汽压力 P、蒸汽温度 T、一个时间步长下的温升率 Tr、一个时间步长下的压力变化 Pr、转速 n、转子初始温度 Ts、表面换热系数 H,即输入向量为 X=(P,Pr,T,Tr,n,Ts,H)。图 4样本原始数据原始特征数据中值域分布差别很大,为了保证神经网络的输入不受量纲的影响,使特征分布范围大致相同,需要对不同特征进行标准化处理。本文选择 Zscore 标准化方法处理原始数据,计算公式为=1NNi=1(xi)2(13)z=x(14)4实验结果与分析利用 ANSYS 有限元分析软件计算的汽轮机转子的危险截面(调节级叶轮根部过渡段)在冷态启动过程中热应力随时间的变化值。汽轮机转子热应力值为时间序列,对训练数据和测试数据进行分区,序列的前 83%用于训练,后 17%用于测试。LSTM 网络训练框图如图 5 所示。4.1超参数的选择在 LSTM 神经网络中,隐藏层神经元数量为网络中循环521图 5LSTM 网络训练框图单元的个数,表示了可以