分享
基于改进型AlexNet的中药材图像识别.pdf
下载文档

ID:3063198

大小:2.03MB

页数:4页

格式:PDF

时间:2024-01-19

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 改进型 AlexNet 中药材 图像 识别
第26卷第9期2023年9月软件工程 S O F T W A R E E N G I N E E R I N GVol.26 No.9Sep.2023文章编号:2096-1472(2023)09-0038-04DOI:10.19644/ki.issn2096-1472.2023.009.007收稿日期:2 0 2 3-0 2-1 0基金项目:甘肃省科技计划项目(2 0 C X 9 N A 0 9 5)基于改进型A l e x N e t的中药材图像识别李万虎,吴丽丽(甘肃农业大学信息科学技术学院,甘肃 兰州 730070);摘 要:文章以百部、白芍、枸杞、黄精、姜黄、蒲黄、蛇床子、益母草、郁金和枳壳片共1 0种中药材为研究对象,使用P y t h o n爬虫算法构建数据集,使用随机缩放、随机剪切、水平翻转对数据集进行增强,对A l e x N e t网络模型进行改进,具体改进内容为在原A l e x N e t网络模型的第三层(卷积层)之后插入一层,为新的第三层,同时在原A l e x N e t网络模型中引入岭回归和迁移学习,建立基于改进型A l e x N e t网络模型的1 0种中药材的图像识别方法,该模型的平均识别准确率达9 5.4%;数据集足够大时,可以有效地提高图像识别准确率,该模型也可应用于绝大部分需要识别的中药材类别的场景。关键词:卷积神经网络;A l e x N e t;中药材;图像识别中图分类号:T P 3 9 1 文献标志码:AI m a g e R e c o g n i t i o n o f C h i n e s e M e d i c i n a l M a t e r i a l s B a s e d o n I m p r o v e d A l e x N e tLI Wanhu,WU Lili(College of Information Science and Technology,Gansu Agricultural University,Lanzhou 730070,China);A b s t r a c t:In this paper,a total of 10 Chinese herbal medicines,including Radix stemonae,Paeonia lactiflora palls,Wolfberry,Rhizoma polygonati,Turmeric,Cattail pollen,Fructus cnidii,Motherwort,Curcuma turmeric,and Aurantium aurantium,are taken as the research objects,Python crawler algorithm is used to build data sets,and random scaling,random clipping,and horizontal flipping are used to enhance the data sets.AlexNet network model is improved by inserting one layer after the third layer(convolutional layer)of the original AlexNet network model,and it becomes a new third layer.At the same time,ridge regression and transfer learning are introduced into the original AlexNet network model to establish an image recognition method for 10 kinds of Chinese medicinal materials based on the improved AlexNet network model.The average recognition accuracy of this model is 95.4%.When the data set is large enough,it can effectively improve the accuracy of image recognition.The proposed model can also be applied to most of the scenarios where the categories of Chinese herbal medicine need to be identified.K e y w o r d s:convolutional neural network;AlexNet;Chinese medicinal materials;image recognition0引言(I n t r o d u c t i o n)我国是中药材的发源地,药材资源丰富,并且9 5%以上的中药材为植物药材。中药历经数千年发展,展现了它强大的生命力和我国医药特色优势。新型冠状病毒感染暴发以来,中医药一直在抗击感染中发挥了重要作用,一些中医药疗法在病例的救治和康复中起到良好效果。因此,我们要坚定不移地推动中医药的发展。目前,传统图像处理和卷积神经网络均可用于中药材识别。孙鑫等1通过构建白薇等5 0种常见中药饮片图像数据库,运用S o f t m a x损失训练网络模型,平均识别精度达到7 0%。屈凌波等2利用人工神经网络对中药进行模式识别,预测率最高能达到9 3.7%。刘勍等3介绍了图像处理技术对中药材的检验过程,然后对中药材图像鉴定与识别技术面临的问题及发展前景做了探讨与展望。徐飞等4通过正交试验优化卷积神经网络,其图像识别准确率为9 0.9%。刘加峰等5建立的中药饮片图像检测识别系统,平均识别率高于8 0%,但只能识别三种中药饮片。分析以上研究可知,在对中药材识别分类研究上,上述方第 26卷第 9期李万虎等:基于改进型 AlexNet 的中药材图像识别法在特定的中药鉴定场景中取得了较好的效果,但对细节特征的关注度不高,鉴别准确度仍然不足。同时,网络模型设计复杂,难以迁移,其鉴定结果不可量化,与实际应用存在差距。本文提出的基于改进型A l e x N e t的中药材图像识别模型可以解决以上问题。1材料与方法(M a t e r i a l s a n d m e t h o d s)1.1数据集本研究以百部(R a d i x s t e m o n a e)、白芍(P a e o n i a l a c t i f l o r a p a l l s)、枸杞(W o l f b e r r y)、黄 精(R h i z o m a p o l y g o n a t i)、姜 黄(T u r m e r i c)、蒲黄(C a t t a i l p o l l e n)、蛇床子(F r u c t u s c n i d i i)、益母草(M o t h e r w o r t)、郁金(C u r c u m a t u r m e r i c)、枳壳片(A u r a n t i u m a u r a n t i u m)共1 0种中药材为对象,数据集通过P y t h o n爬虫算法爬取百度图片里的相关关键字,每一类选取5 0 0张,共5 0 0 0张构成数据集,按照占图像总数量的8 0%、1 0%、1 0%的比例划分出训练集4 0 0 0张、验证集5 0 0张、测试集5 0 0张,将该数据集命名为C MM,如图1所示6。(a)百部(b)白芍(c)枸杞(d)黄精(e)姜黄(f)蒲黄(g)蛇床子(h)益母草(i)郁金(j)枳壳片图1 数据集展示F i g.1 D a t a s e t p r e s e n t a t i o n1.2数据增强由于数据量较小,为了避免训练过拟合,因此需要对原始数据进行增强处理。本研究使用K e r a s(由P y t h o n编写的开源人工神经网络库)中的I m a g e D a t a G e n e r a t o r函数对图片进行随机缩放、随机剪切、水平翻转,对数据进行扩增,再经过数据筛选和数据分布均衡调整,最终构成每类1 0 0 0张,共1 0 0 0 0张图片的新数据集,增强后的数据集命名为C MM 1,按照各占图像总数量的比例进行划分,训练集占比为8 0%,即8 0 0 0张,验证集占比为1 0%,即1 0 0 0张,测试集占比为1 0%,即1 0 0 0张,如表1所示。表 1 实验数据集Tab.1 Experimental data set编号中药材名称英文名图像数量/张A 1百部R a d i x s t e m o n a e1 0 0 0A 2白芍P a e o n i a l a c t i f l o r a p a l l s1 0 0 0A 3枸杞W o l f b e r r y1 0 0 0A 4黄精R h i z o m a p o l y g o n a t i1 0 0 0A 5姜黄T u r m e r i c1 0 0 0A 6蒲黄C a t t a i l p o l l e1 0 0 0A 7蛇床子F r u c t u s c n i d i i1 0 0 0A 8益母草M o t h e r w o r t1 0 0 0A 9郁金C u r c u m a t u r m e r i c1 0 0 0A 1 0枳壳片A u r a n t i u m a u r a n t i u m1 0 0 01.3A l e x N e t模型目前,有多种网络模型可用于图像分类,例如A l e x N e t卷积神经网络、V G G N e t卷积神经网络、R e s N e t残差卷积神经网络等。查阅相关文献,分析评估参数量、可用性、计算资源需求量、易用性等因素,最终将A l e x N e t网络模型作为本研究的基础模型,其模型结构如图2所示。图2 A l e x t N e t网络模型F i g.2 A l e x t N e t n e t w o r k m o d e lA l e x N e t是2 0 1 2年由A l e x K r i z h e v s k y提出的,它以巨大优势赢得了I m a g e N e t 2 0 1 2图像识别挑战赛,自此以后,卷积神经网络在图像识别领域得到迅猛发展7。A l e x N e t网络模型由5个卷积层(C o n v)、3个最大池化层(M a x P o o l i n g)和3个全连接层(D e n s e)构成。卷积层和最大池化层是交替排布的,因为不同卷积层有不同的卷积核,所以提取低层次特征的能力也有所不同。A l e x N e t网络模型的优势在于可以利用双G P U进行网络加速训练,这跟单G P U训练学习相比,学习速度大大提升。A l e x N e t网络模型没有使用传统的S i g m i o d函数而是使用R e L U函数,既解决了梯度弥撒问题,也加快了学习速度。L R N局部响应归一化是在R e L U函数后对局部神经元建立竞争机制,抑制了响应较小的神经元,加强了网络的泛化本领。H i n t o n在2 0 1 2 年的A l e x N e t网络模型中给出其具体的计算如公式(1)所示:bix,y=aix,y/(k+m i n(N-1,i+n2)j=m a x(0,i=n2)(ajx,y)2)(1)公式(1)中,a为卷积层后的输出结果,它是一个四维数组,N是通道数,n为相邻的卷积核,k是偏差,和是自定义的值8。1.4岭回归模型岭回归(R i d g e R e g r e s s i o n)分析用于处理共线性的数据,它是对最小二乘估计法的一种改进方程,也是一种有偏估计的回归方法9;它不考虑最小二乘法的无偏性,而是通过损失一些信息以此获得一个新的回归系数1 0。岭回归分析虽然降低了数据精度,但是更贴近实际应用,因此是一种值得信任的回归方法,对于中药材图像数据的拟合效果比最小二乘法更好。对于传统的最小二乘法线性回归,它的代价函数如公式(2)所示:R S S=ni=1(yi-0-pj=1jxi j)2(2)公式(2)是通过改变拟合系数的大小使R S S值最小,而岭回归分析是在传统的最小二乘线性回归方程中加上正则项(L2范数),用此正则项对参数进行改进。引入正则化项L2范数后,代价函数如公式(3)所示:R=R S S+pj=12j=ni=1(yi-0-pj=1jxi j)2+pj=12j(3)公式(3)中,是一个非负的调节参数,当=0时,结果与传统的最小二乘法一致,没有任何改变。当+?时,R S S占整个代价函数的比重非常小,正则项变得非常大。当拟合系数的值无限接近于零时,代价函数的值取最小。93软件工程2023年9月1.5A l e x N e t网络的改进设计为了构建准确率高和收敛快的网络模型,本文提出了改进型A l e x N e t的中药材图像识别的网络模型,具体的改进设计介绍如下。1.5.1加入岭回归分析我国的中药材中有9 5%以上是植物药材,它们的图像特征等信息有很多的相似之处,如果使用传统模型训练,就会出现过拟合现象,导致识别准确率较低。为了解决该问题,本文研究引入岭回归分析,它可以在一定程度上弱化过拟合问题,对多重共性信息的数据具有较好的分析能力。1.5.2改进A l e x N e t模型通过文献1 1 发现,原A l e x N e t网络模型提取特征能力最强的是第三层和第四层,为了提高分类的精确度,对模型的改进和优化重点集中在这两层。经过多次实验发现,可以在第三层之后插入一层,即新的第三层(如图3所示),新的第三层与原来的第三层结构一致,由于增加了卷积操作,因此可以过滤更多的有效特征,因此特征提取能够更精确。新的第三层卷积核的大小为3*3,数量为1 9 22=3 8 4个,步长为1,使用R e L U激活函数。输入特征图像先扩展一个像素,大小为1 5 1 5;输出特征图像大小为(1 5-3)/1+1=1 3,即1 3 1 3 3 8 4。图3 改进后的A l e x t N e t模型网络结构F i g.3 I m p r o v e d n e t w o r k s t r u c t u r e o f A l e x t N e t m o d e l1.5.3引入迁移学习为了进一步加快训练速度,使模型更快收敛,同时为了提高模型识别的精确度,本研究在模型训练时,引入迁移学习的训练方法。迁移学习可以使用其他大批量数据训练所得模型用于训练新数据,由于大部分数据和任务间存在相关性,因此可以减少训练步骤,缩短训练时间,并增加数据量,达到降低过拟合程度的目的。2结果验证(R e s u l t v e r i f i c a t i o n)2.1实验平台本研究基于P y T o r c h平台搭建,P y T o r c h主要用于自然语言处理,它是一个基于T o r c h的P y t h o n开源机器学习库,不但能够实现G P U加速,而且能支持动态神经网络。实验所用的软硬件环境如下:W i n d o w s 1 0操作系统,AMD i 5-1 0 2 1 0 u,1 6 G B内存,P y t h o n 3.8,J e t B r a i n s P y C h a r m 2 0 1 8.3.7 x 6 4,G P U租用A u t o D L A I算力云,配置的C P U为1 4 核2.0 0 G H z,I n t e l(R)X e o n(R)G o l d 6 3 3 0,内存为3 0 G B。2.2实验验证本文将每个类别8 0 0张,共1 0个类别,总数量为8 0 0 0张中药材图像输入改进后的A l e x N e t网络模型中进行训练,如图4所示,横坐标迭代次数代表权重更新的次数,左侧纵坐标为训练过程中真实值与预测值之间产生的损失值,右侧纵坐标为T o p 1值。模型训练输入的b a t c h_s i z e为1 2 8,圆圈曲线代表T o p 1值,倒三角曲线代表损失值。损失值向0.0趋近,T o p 1值向1.0趋近。在训练过程中,就总体趋势而言,随着T o p 1值的不断增大,损失值不断减小,在部分阶段虽然有反弹的趋势,但是随着训练迭代次数的增加,模型最终克服了局部最优的局面,向全局最优的趋势发展。损失值和T o p 1值最终变得平缓并趋于稳定。图4 双轴图F i g.4 T w o a x i s d i a g r a m3网络模型对比实验(C o m p a r i s o n e x p e r i m e n t o n n e t w o r k m o d e l s)为了验证改进型A l e x N e t网络模型性能的优越性,采用损失值图 如图5(a)所示 和T o p 1值图 如图5(b)所示 与A l e x N e t原网络模型和R e s N e t 5 0网络模型进行对比。图5(a)中圆圈代表改进后的A l e x N e t,黑色填充正方形代表A l e x N e t原网络模型,菱形代表R e s N e t 5 0网络模型,三个网络模型都采用相同的训练参数。从图5可以清晰地看出,本实验提出的改进型A l e x N e t网络的平均识别准确率优于原A l e x N e t网络模型和R e s N e t 5 0网络模型,这证明了改进型A l e x N e t网络模型具有一定的优越性。(a)损失值对比图(b)T o p 1值对比图图5 损失值和T o p 1值对比图F i g.5 L o s s v a l u e a n d T o p 1 v a l u e c o m p a r i s o n c h a r t04第 26卷第 9期李万虎等:基于改进型 AlexNet 的中药材图像识别为了进一步评估改进后的A l e x N e t网络模型、A l e x N e t原网络模型和R e s N e t 5 0网络模型三个网络模型的表现,又选取准确率指标对三个网络模型进行评优。如图6所示,正方形代表改进后的A l e x N e t,三角形代表A l e x N e t原网络模型,圆圈代表R e s N e t 5 0网络模型,选取测试数据集中1 0%的图片作为实验评估时选用的数据集,划分数据集时先打乱数据集后再划分,从而确保实验的说服力。在验证时共设置1 0 0个迭代轮数,每经历5个轮数开启一次验证。由图6可以看出,改进型A l e x N e t网络模型应用于中药材图像识别较A l e x N e t原网络模型和R e s N e t 5 0网络模型更具优势。图6 准确率对比图F i g.6 A c c u r a c y c o m p a r i s o n c h a r t完成模型评估后,开始对训练好的模型进行测试,测试集是数据集总数的1 0%,测试结果以十行十列混淆矩阵的形式展现,如图7所示,横坐标为每一类中药材预测的分类百分比,纵坐标为真实分类百分比。横坐标百分比相加结果应为1,代表对每一类中药材图像正确预测与错误预测之和。图7中横纵坐标重合处对角线代表分类正确的结果,颜色越深,表示分类准确率越高。图7 混淆矩阵F i g.7 M a t r i x o f c o n f u s i o n为了进一步验证训练模型的有效性与准确性,除使用混淆矩阵,还引入P r e c i s i o n(精度)、R e c a l l(召回率)、F 1 S c o r e(平衡F分数)三个指标评价模型,结果见表2。表 2 网络模型评价指标Tab.2 Network model evaluation index分类精度/%召回率/%平衡F分数/%百部9 46 58 0白芍8 98 78 8枸杞9 79 69 4黄精9 59 29 0姜黄9 59 09 0蒲黄1 0 01 0 01 0 0蛇床子9 89 69 7益母草9 29 69 4郁金9 81 0 09 8枳壳片9 69 29 04结论(C o n c l u s i o n)本研究以百部等1 0种中药材为研究对象,构建了1 0种中药材数据集,通过改进A l e x N e t原网络模型,得到了一种用于百部、白芍、枸杞、黄精、姜黄、蒲黄、蛇床子、益母草、郁金和枳壳片等中药材图像识别的卷积神经网络模型,图像识别准确率为9 5.4%,同时解决了模型难以迁移和鉴定结果不可量化的问题。下一步,计划继续提高A l e x N e t网络模型的训练速度和识别精度,主要从两个方面入手,一是增加本研究构建的A l e x N e t网络模型的中药材识别品种,二是继续探索增加新的卷积层数,并优化卷积层与池化层之间的连接。参考文献(R e f e r e n c e s)1 孙鑫,钱会南.基于深度卷积网络的中药饮片图像识别J.世界科学技术-中医药现代化,2 0 1 7,1 9(2):2 1 8-2 2 2.2 屈凌波,相秉仁,安登魁.人工神经网络在中药模式识别中的应用J.计算机与应用化学,2 0 0 2,1 9(4):4 2 8-4 3 1.3 刘勍,刘喜平,温志贤,等.基于图像处理技术的中药材现代检验方法J.自动化与仪器仪表,2 0 1 2(1):1 5 8-1 6 0.4 徐飞,孟沙,吴启南,等.基于卷积神经网络的人参与西洋参饮片鉴别方法研究J.南京中医药大学学报,2 0 1 8,3 4(6):6 2 1-6 2 4.5 刘加峰,高子啸,段元民,等.基于深度学习的中药材饮片图像识别J.北京生物医学工程,2 0 2 1,4 0(6):6 0 5-6 0 8.6 黄方亮,沈同平,金力.改进的A l e x N e t卷积神经网络用于中草药叶片分类J.安庆师范大学学报(自然科学版),2 0 2 0,2 6(3):7 0-7 5.7 K R I Z H E V S K Y A,S U T S K E V E R I,H I N T O N G E.I m a g e N e t c l a s s i f i c a t i o n w i t h d e e p c o n v o l u t i o n a l n e u r a l n e t w o r k sJ.C o m m u n i c a t i o n s o f t h e A C M,2 0 1 7,6 0(6):8 4-9 0.8 郭原东,雷帮军,聂豪,等.基于深度学习的智能高精度图像识别算法J.现代电子技术,2 0 2 1,4 4(4):1 7 3-1 7 6.9 胡良平.岭回归分析J.四川精神卫生,2 0 1 8,3 1(3):1 9 3-1 9 6.1 0 T I B S H I R A N I R.R e g r e s s i o n s h r i n k a g e a n d s e l e c t i o n v i a t h e l a s s oJ.J o u r n a l o f t h e R o y a l S t a t i s t i c a l S o c i e t y:S e-r i e s B(M e t h o d o l o g i c a l),1 9 9 6,5 8(1):2 6 7-2 8 8.1 1 H I N T O N G,D E N G L,Y U D,e t a l.D e e p n e u r a l n e t w o r k s f o r a c o u s t i c m o d e l i n g i n s p e e c h r e c o g n i t i o n:t h e s h a r e d v i e w s o f f o u r r e s e a r c h g r o u p sJ.I E E E S i g n a l P r o c e s s i n g M a g a z i n e,2 0 1 2,2 9(6):8 2-9 7.作者简介:李万虎(1 9 9 0-),男,硕士生。研究领域:图像识别,人工智能与数据挖掘。吴丽丽(1 9 7 9-),女,博士,副教授。研究领域:图像识别,人工智能与数据挖掘。本文通信作者。14

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开