第44卷第4期2023年4月激光杂志LASERJOURNALVol.44,No.4April,2023http∶//www.laserjournal.cn收稿日期:2022-07-21基金项目:广西高校中青年教师基础能力提升项目(No.2020KY17019)作者简介:耿德志(1982-),男,硕士,副教授,研究方向:智能信息处理、数据挖掘技术。大规模光纤网络异常节点数据深度挖掘方法研究耿德志1,宫海晓21晋中学院信息技术与工程系,山西晋中030619;2梧州学院大数据与软件工程学院,广西梧州543002摘要:为解决常用光纤网络异常节点数据挖掘方法耗时长、精度低的问题,提出一种可应用于大规模光纤网络的异常节点数据深度挖掘方法。预处理光纤网络节点数据,提取信息熵特征,并对数据进行降维操作,引入随机森林算法,通过自助采样形成多个随机样本空间,通过投票机制合并处理并输出树群中各棵子树光纤网络异常节点数据深度挖掘结果,实现光纤网络异常节点挖掘。实验结果表明,所提方法的精确度高达99.8%,耗时仅为9.2min,漏检率为0.12%,因此,该方法可以获取高效率、高精度的光纤网络异常节点数据深度挖掘结果。关键词:大规模;光纤网络;异常节点数据;深度挖掘中图分类号:TN929.11文献标识码:Adoi:10.14016/j.cnki.jgzz.2023.04.124Researchondeepminingmethodofabnormalnodedatainlarge-scaleopticalfibernetworkGENGDezhi1,GONGHaixiao21DepartmentofInformationTechnologyandEngineering,JinzhongCollege,Jinzhong030619,China;2SchoolofDataScience&SoftwareEngineering,WuzhouUniversity,Wuzhou543002,ChinaAbstract:Inordertosolvetheproblemoftime-consumingandlowprecisionofcommondataminingmethodsforabnormalnodesinopticalfibernetworks,adeepminingmethodforabnormalnodesinlarge-scaleopticalfibernet-worksisproposed.Preprocessthedataofopticalfibernetworknodes,extracttheinformationentropyfeature,andre-ducethedimensionofthedata.Introducetherandomforestalgorithm,formmultiplerandomsamplespacesthroughself-helpsampling,mergeandoutputthedataminingresultsofabnormalopticalfibernetworknodesofeachsubtreeinthetreegroupthroughthevotingmechanism,soastorealizetheminingofabnormalopticalfibernetworknodes.Theexperimentalresultsshowthattheaccuracyoftheproposedmethodisashighas99.8%,thetime-consumingisonly9.2min,andthemisseddetectionrateis0.12%.Therefore,thismethodcanobtainhigh-efficiencyandhigh...