第40卷第12期2022年12月环境工程EnvironmentalEngineeringVol.40No.12Dec.2022收稿日期:2022-03-02基金项目:甘肃省重点研发计划(21YF5GA053);甘肃省高等学校产业支撑计划项目(2022CYZC-36);国家自然科学基金项目(61762057)第一作者:谢越(1995-),男,硕士,主要研究方向为聚类及复杂网络分析。12201753@stu.lzjtu.edu.cn*通信作者:陈梅(1973-),女,博导,主要研究方向为复杂数据挖掘、模式识别、复杂网络分析。chenmeilz@mail.lzjtu.cnDOI:10.13205/j.hjgc.202212019谢越,陈梅,王有帅.基于一个发现污染类核心区域的聚类模型的大气污染情况分析[J].环境工程,2022,40(12):142-150,179.基于一个发现污染类核心区域的聚类模型的大气污染情况分析谢越陈梅*王有帅(兰州交通大学电子与信息工程学院,兰州730070)摘要:由于污染源受地形、地貌及气象等条件影响而分布多样,大气污染数据在空间中呈任意形状、任意密度的复杂分布。为探究这种大气污染分布状况,基于DP算法提出了1个发现污染类核心区域的聚类模型。以实现对污染数据不经统计直接聚类,在保持空气污染数据分布特征不变的基础上提取出关键污染数据,更准确地挖掘空气污染变化规律。将所提聚类模型和k-Means算法在由兰州市2017,2019,2021年各年1月污染物浓度小时数据构成的3个数据集上进行了对比分析。结果显示:所提模型在以上3个数据集上均能更清晰地挖掘出污染数据,在污染类核心区域中的关键污染数据分别为59.0%、57.2%和69.0%,且造成污染的首要污染物均为NO2和颗粒物。此外,该模型从兰州市2021年1月数据中解析出,兰州市月污染变化由污染物NO2和PM10共同作用或交替作用引起,日污染变化在受污染小时数和首要污染物(NO2和PM10)出现次数上的变化趋势均呈双峰型,污染区域为城关区。并通过分析上述污染规律的成因,证明该模型在确保数据复杂分布不变的情况下提取关键污染数据的有效性。关键词:空气污染;聚类模型;空间分布;簇核心区域ANALYSISOFAIRPOLLUTIONBASEDONACLUSTERINGMODELFORDISCOVERINGTHEBACKBONEOFPOLLUTIONCLUSTERXIEYue,CHENMei*,WANGYoushuai(SchoolofElectronicsandInformationEngineering,LanzhouJiaotongUniversity,Lanzhou730070,China)Abstract:Sincethedistributionofairpollutionsourcesisinfluencedbytopography,landformandmeteorology,thedistributionofairpollutiondatainspaceisofarbitraryshapesanddensities.Tomoreaccu...