基于深度学习的网络流量异常识别与检测①邓华伟1,2,李喜旺1,31(中国科学院沈阳计算技术研究所,沈阳110168)2(中国科学院大学,北京100049)3(辽宁省智能电网云计算专业技术创新中心,沈阳110168)通信作者:李喜旺,E-mail:lixw@sict.ac.cn摘要:针对传统的工控网络流量数据在复杂网络环境下特征维度高,特征处理复杂度高,模型检测效率低等问题,本文使用了一种基于随机森林(randomforest,RF)和长短期记忆网络(longshort-termmemory,LSTM)结合的流量异常识别与检测方法.首先使用随机森林算法计算流量特征的重要度评分,筛选出重要特征,剔除冗余特征,然后使用LSTM进行异常流量的识别与检测.为了评估模型的有效性与优越性,本文使用准确率、精确率、召回率和F1-score进行模型评价,并与传统的机器学习方法NaiveBayes、QDA、KNN算法进行对比.实验结果表明,在公开数据集CIC-IDS-2017中,异常流量识别的总体准确率达99%.与传统的机器学习算法相比,该方法有效地提高了复杂网络环境下异常检测的准确性和效率,在工业控制网络安全和异常检测方面具有实际应用价值.关键词:异常检测;随机森林;特征选择;深度学习;长短期记忆网络引用格式:邓华伟,李喜旺.基于深度学习的网络流量异常识别与检测.计算机系统应用,2023,32(2):274–280.http://www.c-s-a.org.cn/1003-3254/8989.htmlAbnormalNetworkFlowIdentificationandDetectionBasedonDeepLearningDENGHua-Wei1,2,LIXi-Wang1,31(ShenyangInstituteofComputingTechnology,ChineseAcademyofSciences,Shenyang110168,China)2(UniversityofChineseAcademyofSciences,Beijing100049,China)3(LiaoningSmartGridCloudComputingTechnologyInnovationCenter,Shenyang110168,China)Abstract:Aimingattheproblemsofthehighdimensionoffeatures,highcomplexityoffeatureprocessing,andlowefficiencyofmodeldetectionoftraditionalindustrialcontrolnetworktrafficdataincomplexnetworkenvironments,thisstudyusesanabnormalnetworkflowidentificationanddetectionmethodbasedonrandomforest(RF)andlongshort-termmemory(LSTM)network.Firstly,therandomforestalgorithmisusedtocalculatetheimportancescoreofflowcharacteristics,screenoutimportantfeatures,andeliminateredundantfeatures.Then,LSTMisadoptedtoidentifyanddetectabnormalflows.Inordertoevaluatetheeffectivenessandsuperiorityofthemodel,theaccuracy,precision,recall,an...