第41卷第3期2023年3月MACHINERY&ELECTRONICSVol.41No.3Mar.2023收稿日期:2022-05-25基金项目:国家自然科学基金面上项目(62072346)作者简介:李明倩(1985-),女,湖北武汉人,硕士,实验师,研究方向为大学计算机教育教学和科研、数据分析统计;王苗(1988-),女,湖北武汉人,学士,助理实验师,研究方向为微课、精品课程拍摄及后期制作与研究,计算机基础教育研究;刘芳(1980-),女,湖北武汉人,博士,副教授,研究方向为数据库、数据挖掘及大数据。改进k-means的电网控制自动化系统数据聚类方法李明倩1,王苗1,刘芳2(1.武汉城市学院实验实训中心,湖北武汉430083;2.武汉大学计算机学院,湖北武汉430072)摘要:为了解决海量数据导致电网控制效率低的问题,提出改进k-means的电网控制自动化系统数据聚类方法。首先,利用主成分分析法提取出电网控制自动化系统数据主成分,将数据简化和降维;然后,通过滤波去噪处理电网数据,保证聚类样本干净整洁;最后,在改进k-means聚类算法下对数据聚类,确定k值得到最优聚类结果,实现电网控制自动化系统数据聚类。实验结果,对比每组样本下3种方法的Sil-houette值,每组实验中Silhouette值的最大值都是所提方法,说明所提方法的聚类难度小和频率控制稳定性小。关键词:k-means;电网控制;主成分分析;数据去噪;数据聚类中图分类号:TM734文献标志码:A文章编号:1001-2257(2023)03-0034-05Improvedk-meansDataClusteringMethodforPowerGridControlAutomationSystemLIMingqian1,WANGMiao1,LIUFang2(1.ExperimentalTrainingCentre,WuhanCityCollege,Wuhan430083,China;2.SchoolofComputerScience,WuhanUniversity,Wuhan430072,China)Abstract:Inordertosolvetheproblemoflowpowergridcontrolefficiencycausedbymassivedata,adataclusteringmeth...