第49卷第2期2023年2月ComputerEngineering计算机工程基于卷积神经网络的结构化非平衡数据分类算法徐红1,矫桂娥2,3,张文俊2,陈一民3(1.上海海洋大学信息学院,上海201306;2.上海大学上海电影学院,上海200072;3.上海建桥学院信息技术学院,上海201306)摘要:卷积神经网络具有高效的特征提取能力和较少的参数量,被广泛应用于图像处理、目标跟踪、自然语言等领域。针对传统分类模型对于结构化非平衡数据分类效果较差的问题,提出一种基于卷积神经网络的二分类结构化非平衡数据分类算法。设计结构化数据处理算法Data-Shuffle,将原始非平衡一维结构化数据转换为三维数组形式的多通道非平衡数据,为卷积神经网络提供更多的特征值,通过改进的VGG网络构建适合非平衡数据的网络结构卷积组,以提取不同的特征。在此基础上,提出更新权重加权采样算法UWSCNN,在每个迭代次数之后,根据模型的训练结果对易错样本进行重新加权,以优化训练结果。在adult、shoppers和diabetes数据集上的实验结果表明,相比逻辑回归、随机森林等传统机器学习模型,所提的Data-Shuffle算法的F1值提升了1%~19%,G-mean提升了2%~24%,相比SMOTECNN、BSMOTECNN、SMOTECNN+CS等采样算法,所提的UWSCNN算法对非平衡数据的分类效果提升了1%~13%,有效提高模型对非平衡数据的分类性能。关键词:非平衡数据;结构化数据;VGG网络;深度学习;卷积神经网络开放科学(资源服务)标志码(OSID):中文引用格式:徐红,矫桂娥,张文俊,等.基于卷积神经网络的结构化非平衡数据分类算法[J].计算机工程,2023,49(2):81-89.英文引用格式:XUH,JIAOGE,ZHANGWJ,etal.Classificationalgorithmforstructuredimbalanceddatabasedonconvolutionalneuralnetwork[J].ComputerEngineering,2023,49(2):81-89.ClassificationAlgorithmforStructuredImbalancedDataBasedonConvolutionalNeuralNetworkXUHong1,JIAOGuie2,3,ZHANGWenjun2,CHENYimin3(1.CollegeofInformationTechnology,ShanghaiOceanUniversity,Shanghai201306,China;2.ShanghaiFilmAcademy,ShanghaiUniversity,Shanghai200072,China;3.CollegeofInformationTechnology,ShanghaiJianQiaoUniversity,Shanghai201306,China)【Abstract】ConvolutionalNeuralNetwork(CNN)arewidelyusedinimageprocessing,objecttracking,naturallanguage,andotherfieldsbecauseoftheirefficientfeatureextractioncap...