分享
基于LASSO回归的R-v...在化工过程故障检测中的应用_邓红涛.pdf
下载文档

ID:2249135

大小:1.62MB

页数:8页

格式:PDF

时间:2023-05-04

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 LASSO 回归 化工 过程 故障 检测 中的 应用 邓红涛
第 卷第期重 庆 大 学 学 报 年月 :基于 回归的 模型构建及其在化工过程故障检测中的应用邓红涛,贾琼,李绍军,李伟(石河子大学,新疆 石河子 ;华东理工大学 化工过程先进控制和优化技术教育部重点实验室,上海 )收稿日期:网络出版日期:基金项目:国家自然科学基金资助项目()。()作者简介:邓红涛(),女,硕士,副教授,主要从事数据处理、过程建模、优化与控制研究,()。通信作者:李伟,男,硕士,副教授,主要从事数据处理、智能控制方向研究,()。摘要:模型在描述高维数据间的非线性、非高斯特性相依关系问题上提供了一种新的思路,在化工过程建模领域受到越来越多关注。笔者将 ()回归引入 (,),根据变量间联系的强弱程度确定变量在 矩阵中的位置,利用回归分析正则化路径选择 矩阵结构,遵循 矩阵构建规则和回归过程确定 结构矩阵模型,以获得一个与变量独立性有关的稀疏矩阵模型。该方法构建的矩阵结构独立于 函数类型和参数,在处理高维度复杂工业过程数据时,利用稀疏模型和惩罚力度简化 函数类型选择过程,缩短了建模时间,使统计建模具有更强的灵活性。该方法在()和醋酸脱水过程故障监测中表现出较好的预测效果,证明了提出的方法在非线性、非高斯过程的有效性。关键词:过程监控;相关性;回归中图分类号:文献标志码:文章编号:(),(,;,):,(),(),:;过程安全和产品质量是目前化工过程被关注最多的两个问题,而过程监控是提高过程安全和产品质量的重要手段。随着集散控制和数据采集系统的广泛应用,工业过程采集数据的维度和数据量不断增加,导致基于经验知识和解析模型的方法在工业过程监控领域的研究受到了限制。基于数据驱动的故障监控建模方法通过统计与分析过程数据来挖掘系统的特性,在描述未知机理模型和缺乏过程知识的复杂过程问题研究中备受学术和工业界关注。传统的数据分析方法有偏最小二乘法()和主元分析法(),这两种方法适合分析具有线性、高斯分布特性数据。而处理非线性数据时常使用核方法来对这两种方法进行改进,进而形成核偏最小二乘()法、核主元分析()法等。这些方法主要是基于降维的方式将高维数据映射到低维特征空间,消除变量间的相关性,但在降维过程中数据携带信息量都会有一定的损失。近年来,针对复杂数据的相关性研究中,理论得到了广泛的应用,将联合概率分布函数与边缘概率分布函数之间的相关性结构建立联系。由于多变量 在构建维数较大的数据间的依赖性时缺乏灵活性,提出了 ,该方法是将多变量 用一系列的二元 来表示,该方法在刻画高维数据的条件相关性、非对称性、尾部相关性等方面均体现出更大的灵活性,已经在金融、环境、工程等领域得到了广泛的应用。年 等首先将 函数引入到化工过程监控领域,提出了基于 相关性描述的多模态故障检测方法。等利用 混合模型实现了对复杂的工业过程监控。周南等利用核密度估计法构建 结构并用在工业过程故障检测中。由于二元 函数类型众多,结构矩阵不固定,选取合适的 结构矩阵和 函数类型成为建模的关键环节。目前常规方法是利用贪婪算法计算所有可能矩阵结构下变量之间的相关关系,选择相关性最大的矩阵结构,然后根据赤池准则()选取 函数类型和参数 。这种方法在处理高维的工业过程数据时,会出现计算量大、计算时间长的问题,其解也不能保证接近该高维组合优化问题的最优解。笔者在构建 模型时引入 回归来统计变量之间的相关关系,根据变量间联系的强弱程度确定变量在 矩阵中的位置,利用回归分析正则化路径选择 矩阵结构。遵循 矩阵构建规则和回归过程中惩罚力度调整变量在矩阵中的位置,确定 结构矩阵模型,以获得一个与变量独立性有关的稀疏矩阵模型。该方法构建的矩阵结构独立于 函数类型和参数,在处理高维度复杂工业过程数据时,利用稀疏模型和惩罚力度简化 函数类型选择过程,缩短了建模时间,使统计建模具有更强的灵活性。该方法应用在 ()过程中表现出较好的检测效果。理论基础和 回归 年 第一次提出用 函数分析复杂变量间的相关关系,将多维变量的联合分布函数用边缘分布函数和 函数表示,但是这种 函数面对高维数据时会出现参数过多而导致优化困难的问题。年 提出了 结构。结构分解具有较大的灵活性,分解策略 较多 。年 等 定义了 结构分解模型,相应的多元分布结构称为 结构,可以更加灵活地表达变量之间的关系。重 庆 大 学 学 报第 卷构建 结构矩阵规则用树结构来表示 结构,对于维变量的 分布,包含了棵树,每棵树由节点和边组成。两个节点确定一条边,每条边用二元 函数表示。由于 结构分解模型多样,树型结构不唯一。为了更好地表示 的结构,年 等 研究了一种 结构模型,利用一个下三角矩阵来表示 分解模型,用矩阵可以简单地表示出 结构中的树集、节点集和边集。对一个维变量的 结构,可以用一个的下三角矩阵表示,矩阵对角线元素代表变量,中的。用,表示第行第列矩阵元素,(,),(,)。矩阵元素之间需要满足以下条件:),。即第列元素集,属于第列元素集,。图维变量的 矩阵 ),。即第列元素集,不包含第列对角线上元素,。),。即如果矩阵元素集,(,),(,),那么一定存在包含或等于的元素集,。设满足以上规则的矩阵中第行第列元素集合为。根据以上条件可以发现矩阵中元素位置是互相约束的,如图所示矩阵,组成第列的变量,包含在第列,中;第列对角线元素 不会出现在第、列中;第列画圈元素组成元素集,那么至少第列中存在包含的元素集,。假设画圈元素,为,和第列中行数大于的元素组成元素集,。列数大于、行数大于等于的元素和对角线元素(带上横线元素)组成的元素个数大于等于的元素集,、,、,这些元素集中包含元素的只有,根据条件可知画圈位置的元素只能在变量集,中选取。利用矩阵表示联合密度函数利用 的矩阵结构,不需要画树结构就可以快捷地表示出多维变量的联合密度函数。矩阵元素,和第列元素可以表示树的第个二元 函数(),()()()(),()(),其中(),(),(),(,),(,),为条件累计分布函数。维变量的联合概率密度可以表示为边缘概率密度()与 密度函数的乘积形式:(,)(),(,),(,)。()式中:()为第个变量的边缘概率密度函数,为二元 函数,(,:,)为,的条件累计分布函数。图所示矩阵为 结构矩阵,矩阵中元素的值代表变量,。矩阵中画圈元素,对应二元 为:,变量,条件密度可以用第列所有元素的二元 函数之积和对角线元素的边缘密度表示:()(),。()联合概率密度为:(,)()()()()()。()根据矩阵求维变量联合概率密度,即:第期邓红涛,等:基于 回归的 模型构建及其在化工过程故障检测中的应用(,)()()()()(),。()在满足矩阵规则的前提下构造合理的 结构矩阵是构建 模型的关键。目前常用贪婪算法构建 树的结构矩阵,计算树节点之间的相关性,按照最强相依性原则遍历所有可能的矩阵结构,寻找最大相关系数之和以构建 结构矩阵,并在整个结构选择过程中迭代拟合 函数及其参数。此方法计算时间长,计算量大,构建的模型结构复杂,容易出现过拟合现象。回归线性回归表示变量间相互依赖的定量关系,变量,回归函数如下:,()式中为变量的回归系数。回归是一种数据降维方法,善于处理变量的筛选。年 首次在普通线性回归模型中添加了惩罚项,通过改变惩罚项将一些作用比较小的变量线性系数压缩,最终变为零,从而获得稀疏解。这种基于惩罚方法对样本数据进行变量选择,防止了数据过拟合,不但可以用于线性关系,也可以用于非线性关系。回归损失函数公式如下:()()(),()式中:()是根据式()计算预测第个样本的值,因变量为真实样本值,为样本个数,(,),为正则化参数,为参数个数,(,)。随着增大,各变量的系数逐渐趋于零。利用 回归构建 矩阵将 回归算法用于构建 结构矩阵,提出一种新的构建 结构矩阵的方法。如构建维变量,的 结构矩阵。首先确定 结构矩阵中的对角线元素。将变量带入式(),按照式()利用交叉验证方法确定过程变量(,)的 回归方程。,。()式中:,且。根据式()统计个回归方程中变量的回归系数,非零的个数,按照的升序将变量设为 结构矩阵的对角线元素,当出现次数相同时按照回归系数的和排序。,。()如图所示,矩阵确定对角线元素时,存在,那么对角线元素为,。接下来按照从右往左、从下至上的顺序确定矩阵中的其他元素。如确定矩阵中的变量,以矩阵对角线元素,为因变量,根据 结构矩阵构建规则,以满足元素集的元素为自变量,带入式(),根据式()利用最小回归角方法选择变量,当回归系数依次置为零时,惩罚项最大的变量即为,。(),()(),()式中:为根据 矩阵规则确定的此处可放置的变量集合,是属于集合的元素。确定图中矩阵第行第列的元素,根据 矩阵规则可知,然后按照从右往左、从下重 庆 大 学 学 报第 卷至上的顺序依次确定,、,、,、,、,、,、,、,、,。确定画圈元素,时,根据构建 结构矩阵规则推出可用变量,则以,为自变量,以,和,为因变量,按照式()利用 回归计算回归系数,按照式()利用最小回归角方法调整惩罚项。当时;时。因为存在,那么,。基于 构建 模型的故障检测方法本研究中利用 回归过程反映变量之间关系的特点,按照变量回归系数归零速度和惩罚项大小确定 结构矩阵,利用正常样本数据根据赤池准则确定 模型中参数,构建模型,利用阈值法进行在线故障检测(如图所示)。图 过程监控方法示意图 离线建模)获得正常操作过程的训练样本集,按照第节方法构建 矩阵。)根据 矩阵确定 对和参数,构建 模型。合适的 对能够精确地描述变量数据间的相关关系。采用基于似然函数的赤池信息准则 选取最合适 对类型。赤池准则是权衡被估计模型复杂度和拟合优越性的一种标准,其定义如下:(?)。()式中:是 函数的参数个数,一般为个;为似然函数;?为 函数参数的估计值。根据赤池准则选最小 类型确定 模型。根据式()计算样本数据联合概率密度。)确定检测阈值。计算样本点的联合概率密度,利用分位数法求对应的联合概率密度中阈值。该方法根据高密度区域与密度分位数理论构建广义贝叶斯推断概率指标(),阈值选取 的控制限,监测时对比静态密度分位数表确定监测状态。在线监控)利用模型计算监测数据联合概率密度函数。)以阈值为界限,小于阈值则为故障数据。第期邓红涛,等:基于 回归的 模型构建及其在化工过程故障检测中的应用应用分析 过程 公司依照实际的化工反应过程开发了 测试平台,仿真数据具有非线性、时变和强耦合性等特征,能很好地模拟复杂工业过程,被广泛应用于控制、优化、过程监控与故障诊断的研究。数据集由训练集和测试集构成,数据集包含了正常状态数据和 种故障状态数据,每个样本都有 个观测变量,其中连续变量 个,操纵变量 个和成分变量 个。本研究所用数据可从 :下载,在离线状态下选取了正常工况下样本 个变量中的 个连续的过程变量构建 模型,采用 个正常样本点来建立模型,每种故障状态的测试数据也选用 个样本点进行测试,对 个故 障 数 据 进 行 监 测。将 本 研 究 中 提 出 的 方 法 与 独 立 成 分 分 析()、高 斯 混 合 模 型()、()等算法计算 过程故障检测率进行比较,结果见表,其中和 是 故障检测的统计指标,指标衡量样本向量在主元空间的变化,指标衡量样本向量在残差空间的投影的变化,是贝叶斯推理的后验概率()指标,指利用 模型和 模型下的广义贝叶斯推断概率指标。表中粗体表示检测效果最好的值。表 过程故障检测率对比表 故障序号 故障序号 可以看出利用 回归构建的 模型监测结果优于 贪 婪 算 法 构建 矩阵 建模,与、方法 比较具有较高的检测率。模型的故障检测率都略高于利用贪婪算法构建矩阵的模型检测率,在故障、中都表现出较好的检测效果,其他故障的检测效果和其他方法相差不多。模型有 类故障的检测率都高于 方法的检测结果,相比于 检测方法在故障、中都表现较好检测率。过程中数据具有非高斯态的特性,方法是基于马氏距离判断数据是否异常,反映数据的非高斯特性能力较差;方法在数据变换和特征提取的过程中会造成部分信息的损失。而 方法利用 回归建立 矩阵构建模型,全面挖掘出数据变量

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开