温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
NSGA
自适应
尺度
特征
通道
分组
优化
算法
王彬
2023-05-10计算机应用,Journal of Computer Applications2023,43(5):1401-1408ISSN 1001-9081CODEN JYIIDUhttp:/基于NSGA-的自适应多尺度特征通道分组优化算法王彬1,2*,向甜1,吕艺东1,王晓帆1(1.西安理工大学 计算机科学与工程学院,西安 710048;2.陕西省网络计算与安全技术重点实验室(西安理工大学),西安 710048)(通信作者电子邮箱)摘要:针对轻量型卷积神经网络(LCNN)的精确度和复杂度均衡优化问题,提出基于快速非支配排序遗传算法(NSGA-)的自适应多尺度特征通道分组优化算法对LCNN特征通道分组结构进行优化。首先,将LCNN中的特征融合层结构的复杂度最小化和精确度最大化作为两个优化目标,进行双目标函数建模及理论分析;然后,设计基于NSGA-的LCNN结构优化框架,并在原始LCNN结构的深度卷积层之上增加基于NSGA-的自适应分组层,构建基于NSGA-的自适应多尺度的特征融合网络NSGA2-AMFFNetwork。在图像分类数据集上的实验结果显示,与手工设计的网络结构M_blockNet_v1相比,NSGA2-AMFFNetwork的平均精确度提升了1.220 2个百分点,运行时间降低了41.07%。这表明所提优化算法能较好平衡LCNN的复杂度和精确度,同时还可为领域知识不足的普通用户提供更多性能表现均衡的网络结构选择方案。关键词:轻量型卷积神经网络;特征提取通道分组优化;双目标函数建模;快速非支配排序遗传算法;图像分类;进化算法中图分类号:TP183;TP399 文献标志码:AAdaptive multi-scale feature channel grouping optimization algorithm based on NSGA-WANG Bin1,2*,XIANG Tian1,LYU Yidong1,WANG Xiaofan1(1.School of Computer Science and Engineering,Xian University of Technology,Xian Shaanxi 710048,China;2.Shaanxi Key Laboratory for Network Computing and Security Technology(Xian University of Technology),Xian Shaanxi 710048,China)Abstract:Aiming at the balance optimization problem of Lightweight Convolutional Neural Network(LCNN)in accuracy and complexity,an adaptive multi-scale feature channel grouping optimization algorithm based on fast Non-dominated Sorting Genetic Algorithm(NSGA-)was proposed to optimize the feature channel grouping structure of LCNN.Firstly,the complexity minimization and accuracy maximization of the feature fusion layer structure in LCNN were regarded as two optimization objectives,and the dual-objective function modeling and theoretical analysis were carried out.Then,a LCNN structure optimization framework based on NSGA-was designed,and an adaptive grouping layer based on NSGA-was added to deep convolution layer in original LCNN structure,thus constructing an Adaptive Multi-scale Feature Fusion Network based on NSGA2(NSGA2-AMFFNetwork).Experimental results on image classification datasets show that compared with the manually designed network structure M_blockNet_v1,NSGA2-AMFFNetwork has the average accuracy improved by 1.220 2 percentage points,and the running time decreased by 41.07%.This above indicates that the proposed optimization algorithm can balance the complexity and accuracy of LCNN,and also provide more options for network structure with balanced performance for ordinary users who lack domain knowledge.Key words:Lightweight Convolutional Neural Network(LCNN);feature extraction channel grouping optimization;dual-objective function modeling;fast Non-dominated Sorting Genetic Algorithm(NSGA-);image classification;evolutionary algorithm0 引言 卷积神经网络(Convolutional Neural Network,CNN)在计算机视觉领域,如医疗1、人体识别2-3、智能驾驶4-6、生物医学图像识别7-8、农业图像处理9-10等被广泛应用。随着CNN研究的不断深入,其网络结构的复杂度也随之增加,导致因计算效率降低而难以移植到计算能力受限的设备中。因此,在无法搭载较强计算能力硬件的设备上,如何继续保持CNN的特征提取能力成为值得研究的课题。近些年,轻量化 CNN技术11-13得到逐步发展,可简要概括为针对网络结构冗余问题提出的模型压缩和针对性能退化提出的模型重构两大类14。模型压缩主要包括知识提文章编号:1001-9081(2023)05-1401-08DOI:10.11772/j.issn.1001-9081.2022040581收稿日期:2022-04-24;修回日期:2022-06-19;录用日期:2022-07-01。基金项目:国家自然科学基金资助项目(61976177,U21A20524)。作者简介:王彬(1971),男,陕西西安人,副教授,硕士,CCF会员,主要研究方向:进化计算、神经网络;向甜(1997),女,陕西西安人,硕士研究生,主要研究方向:进化计算;吕艺东(1995),男,陕西西安人,工程师,硕士,主要研究方向:神经网络;王晓帆(1976),男,河北石家庄人,教授,博士,CCF会员,主要研究方向:智能信息处理。第 43 卷计算机应用取、网络剪枝、权值转化等15-17,旨在保持或稍微降低精确度的情况下提升网络计算效率。模型重构主要指重新设计轻量型卷积神经网络(Lightweight CNN,LCNN)结构,例如利用深度可分离卷积或分组卷积构建新的 LCNN 结构,以提高CNN 的计算效率。尽管这些 LCNN 在计算效率方面取得了不小进步,但仍不可避免地出现精确度退化情况,如何优化LCNN 结构成为亟待解决的问题。目前,一些先进的 LCNN结构都是由具有领域知识的研究者手工设计的,因此会存在该网络结构设计并不能有效解决当前机器学习任务的问题,这在一定程度上会弱化网络的性能表现和泛化能力。近几年,进化算法(Evolutionary Algorithm,EA)在深度卷积神经网络的结构优化中得到应用,能提升优化后的网络性能。EA是一种受生物演化过程启发的全局优化方法,由于它的应用领域具有不受问题性质限制的特点,在深度学习等领域得到了应用和发展。经典的进化算法启发于模仿生物界种群更新的方式,通过变异、高斯交叉和选择的过程,在连续或离散的决策空间中高效搜索最优解。多目标算法的目标是求出一组各个目标之间权衡关系的近似的帕累托(Pareto)最优解集。常见的多目标进化算法包括三类:基于Pareto支配关系的快速非支配排序遗传算法18-21等;基于分解的多目标进化算法22等;基于指标的多目标进化算法23等。2018年,Wang等24使用网络协议地址编码,采用的适应度函数为每批精确度平均值,同时使用随机划分数据集的方式加速适应度评估,提出了基于变长粒子群优化的神经网络结构。该方法试图利用粒子群算法自适应堆叠卷积神经网络模块,已经无须人工干预便可设计出解决图像分类问题的CNN结构。由于超参数优化问题是非凸且不可微的,并且完整训练整个网络所需时间长,因此不必知道整个训练过程的最佳网络性能。出于该动机,Sun等25利用粒子群算法网格化地搜索自动堆叠网络模型最匹配优化任务的超参数,显著降低了网络模型计算复杂度。他们设计了一种超参数优化方法,用堆叠自适应编码器执行了 192个实验对比,堆叠自适应编码器是一类具有较少超参数的深度学习算法,旨在研究进化算法和网格搜索在搜索堆叠自适应编码模型的最优超参数时的性能。2019年,Lu等26提出的高级神经体系结构搜索方法将误差度量(指标为图像分类正确率)和计算复杂度(指标为每秒浮点运算次数(FLoating-point Operations Per second,FLOPs)作为待优化的两个目标函数,经过种群初始化、探索和开发三个步骤,有效探索了有潜力的神经网络结构空间。这些基于EA的深度卷积神经网络在一定程度上实现了不依赖专业知识和人工干预来优化提升网络结构性能的目的。本文针对 LCNN 结构的复杂度和精确度优化不平衡问题,进行双目标函数建模及分析,提出基于NSGA-的自适应多尺度特征通道分组优化算法,构建基于NSGA-的自适应多尺度的特征融合网络 NSGA2-AMFFNetwork,并在图像分类数据集上验证了优化算法的有效性。1 相关工作 1.1非均匀通道分组LCNN的参数量和计算量随着其复杂度的提升而增加,影响了 LCNN 的计算速度。2020 年,笔者在 M_blockNet_v1结构中提出了基于非均匀通道分组多尺度的特征融合方法(图1)27,以进一步降低参数量和计算量。图 1中,LCNN 的特征融合采用基于膨胀卷积的多尺度特征融合模块代替原有的1 1点卷积的特征融合;然后,将输入特征图通道分成G组,其中,1 1点卷积、3 3基本卷积以及3 3膨胀卷积操作对应的输入和输出通道数分别为g1、g2和g3;最后,连接不同尺度通道提取到的特征图得到最终的输出特征图,以减少计算量和参数量。该方法中,每个尺度的卷积核输入仅包含部分的输入特征图,目的是减少参数量以及运算量,但该方法需要手动设计和寻找相关的合适参数。1.2自动分组多尺度特征融合为了能自动设计相关参数,提高 LCNN 的精确度,笔者在SSCA_MblockNet中提出了一种自动分组的多尺度特征融合方法(如图2)28。在分组多尺度特征提取的基础上,该方法首先利用单目标进化算法对输入特征通