第48卷第2期2023年2月环境科学与管理ENVIRONMENTALSCIENCEANDMANAGEMENTVol.48No.2Feb.2023收稿日期:2023-02-15作者简介:尤辰汀(1986-),女,大学本科,工程师,研究方向:污染源监测监控。文章编号:1674-6139(2023)02-0133-06基于数据特征分析的污染源监测数据异常值识别方法研究尤辰汀(苏州市环境监测站(苏州市环境监控中心),江苏苏州215000)摘要:为避免在污染源监测时因为存在一些异常值影响数据可靠性,本次研究设计了一种基于数据特征分析的污染源监测数据异常值识别方法。先对污染源监测数据进行去噪处理,通过关联度分析方法对去噪处理后的数据实施数据特征分析,完成异常值中失效值的识别。然后基于LSTM网络构建离群异常值识别模型,实现污染源监测数据中离群异常值的识别。最后通过实验证明设计方法的先进性,该方法能够实现污染源监测数据异常值识别,模型拟合程度最高可达0.98,对于失效值与离群异常值的识别精度均较高。关键词:数据特征分析;去噪处理;LSTM网络;污染源监测数据;异常值识别中图分类号:X83文献标志码:AOutlierIdentificationofPollutionSourceMonitoringDataBasedonDataFeatureAnalysisYouChenting(SuzhouEnvironmentalMonitoringStation(SuzhouEnvironmentalMonitoringCenter),Suzhou215000,China)Abstract:Inordertoavoidsomeoutliersaffectingdatareliabilityduringpollutionsourcemonitoring,thisstudydesignedamethodforidentifyingoutliersofpollutionsourcemonitoringdatabasedondatafeatureanalysis.First,thepollutionsourcemonito-ringdataisde-noised,andthenthede-noiseddataisanalyzedbythecorrelationanalysismethodtocompletetheidentificationoftheinvalidvalueintheabnormalvalue.ThenanoutlieridentificationmodelisbuiltbasedonLSTMnetworktorealizeoutlieri-dentificationinpollutionsourcemonitoringdata.Finally,theexperimentprovesthatthedesignmethodisprogressiveness.Thismethodcanrealizetheidentificationofabnormalvaluesofpollutionsourcemonitoringdata,andthemodelfittingdegreecanreach0.98atmost.Theidentificationaccuracyoffailurevaluesandoutliersishigh.Keywords:datafeatureanalysis;denoising;LSTMnetwork;pollutionsourcemonitoringdata;abnormalvalueidentification前言随着工业技术与社会经济的迅速发展,大气环境污染问题与水环境污染问题等成为社...