投稿网址:www.stae.com.cn2023年第23卷第5期2023,23(5):02007-09科学技术与工程ScienceTechnologyandEngineeringISSN1671—1815CN11—4688/T收稿日期:2022-06-17;修订日期:2022-11-15基金项目:中国电力科学研究院有限公司武汉分院项目(JLW51202100757)第一作者:李强(1996—),男,汉族,山西长治人,硕士研究生。研究方向:电力信息物理系统安全。E-mail:liqiang6414@126.com。*通信作者:张立梅(1972—),女,汉族,河北保定人,硕士,副教授。研究方向:新能源规划、智能优化算法。E-mail:lmzhang09@126.com。引用格式:李强,张立梅,白牧可.基于多元数据特征和改进随机森林的智能配电网异常数据辨识[J].科学技术与工程,2023,23(5):2007-2015.LiQiang,ZhangLimei,BaiMuke.Identificationofabnormaldatainsmartdistributionnetworkbasedonmultivariatedatafeaturesandim-provedrandomforest[J].ScienceTechnologyandEngineering,2023,23(5):2007-2015.基于多元数据特征和改进随机森林的智能配电网异常数据辨识李强1,张立梅1*,白牧可2(1.河北农业大学信息科学与技术学院,保定071000;2.中国电力科学研究院有限公司,北京100192)摘要智能配电网异常数据的准确辨识对于提高电网安全运行和调度具有重要意义。提出一种基于多元数据特征和改进随机森林算法的异常数据辨识方法。首先,在分析异常数据辨识过程的基础上,利用K-means、箱线图法等提取原始数据异常特征;考虑配电网技术需求,挖掘电网运行的衍生特征。其次,针对类不平衡问题,提出结合过采样方法的混合Bootstrap抽样和加权投票策略,引入信息增益率优化最优特征选择,增加算法稳定性。最后,仿真分析了决策树数量和衍生特征对算法辨识性能的影响,并与支持向量机、神经网络等算法进行性能比较。实验结果表明所提方法有效、合理,具有优异的辨识性能和效率。关键词异常数据辨识;随机森林;多元数据特征提取;智能配电网中图法分类号TM769;文献标志码AIdentificationofAbnormalDatainSmartDistributionNetworkBasedonMultivariateDataFeaturesandImprovedRandomForestLIQiang1,ZHANGLi-mei1*,BAIMu-ke2(1.CollegeofInformationScience&Technology,HebeiAgriculturalUniversity,Baoding071000,China;2.ChinaElectricPowerResearchInstituteLimitedCompany,Beijing100192,China)[Abstract]Accurateidentificationofabnormaldatainsmartdistributionnetworksi...