温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
中药材
鉴别
模型
20.
大学生
数学
建模
竞赛
题为
伍星
71 技术创新2021年全国大学生数学建模E题要求对不同中药材的种类或的中红外光谱图的数据。在此基础上我们提出:是否可以通过者对同种药材的不同产地建立数学模型进行鉴别,本文利用excel光谱图绘制得到结果;建立K-J均值聚类模型,分析所给药材可和spss软件对其附件1-4中光谱数据进行数据清洗,剔除异常以聚成几类;如何对每类药材进行特征和差异性描述。值,利用Unscrambler软件做归一化分析;再利用excel软件对数对于问题2,与问题1相比多了产地。首先,需要对附件中据进行折线图绘制,对药材类别进行预判,借助spss软件进行K-数据进行产地分类,再利用Spss和Excel软件分析各个产地之间均值聚类、去中心化处理,以及PCA三维和二维散点图,分别给光谱的特征与差异性,统计分析均值、方差、标准差等。其出每类药材的不同产地的中红外光谱曲线图和对应种类的特次,考虑各产地光谱样本的聚合性,剔除异常数据值,再利用征;利用判别分析法对11个不同产地样本做循环分析,结合判均值中心化处理数据。最后,利用判别分析法对不同产地样本别分析分别和分类讨论法,完成中药材的鉴别。做分析,单独一次效果可能不佳,需要进行交叉验证,提高模型识别率。1 背景资料对于问题3,利用归一化处理后的数据,对原始光谱做中药材是药品的重要组成部分,随着科技的发展、时代的PCA三维和二维散点图,确定主成分因子,建立PCA样本模型。进步,人们发现中药材会因为其生产地、种类的不同,使得其再利用SPSS软件对17个不同产地的数据进行判别分析模型多次无机元素的化学成分、有机物等存在差异性,进而在近红外、分析识别,得到不同的模型识别结果,再对比分析,提高识别中红外的照射下也会表现出不同的光谱特征,不同类药材表现率。的光谱特征差异较大,比较容易判别。然而,不同产地的同一3 解决问题种药材在同一波段内的光谱比较接近,使得光谱鉴别的误差较3.1 问题1的模型建立与求解大。相关部门想要通过这些光谱特征来鉴别中药材的种类及产根据所给中红外光谱数据进行药材分类,主要着眼于光谱地,更好的判定中药材的品质,使得中药材可以被更好的利图的比较,即首先是吸收峰的数目是否一致,其次是峰位是否用。在此背景下,需要解决如下问题:一致,然后是各谱带的相对强弱是否一致,最后是谱带的形状(1)数据参照2021年高教社全国大学生数学建模竞赛E题是否一致。若所给药材光谱图的峰数、峰位、峰强和峰形一附件1中几种药材的中红外光谱数据,将药材进行分类,并研究致,则认为是同一类药材;若两个光谱图不同,则可判定为两不同种类药材的特征和差异性。种不同药材。但下此结论时,需要考虑以及有无其他外界因素(2)根据附件2中某一种药材的中红外光谱数据,分析不的干扰。我们根据中红外光谱图进行预判,药材的种类大致为同产地药材的特征和差异性,建立数学模型,并鉴别所给药材4类。的产地。模型建立:输入簇的数目k和包含n个对象的数据库,输出(3)根据附件3中某一种药材的近红外和中红外数据,将k个簇,使平方误差准则最小。聚类原理:将样本分配给距离它两种数据对比分析找到不同产地药材的特征,建立同种药材不们最近的中心向量,并使目标函数值减小。同产地的数学模型,并鉴别所给药材的产地。更新簇平均值2 问题分析相关部门想要通过这些光谱特征来鉴别中药材的种类及产计算准则函数E地,更好的判定中药材的品质,使得中药材可以被更好的利用。为此,我们针对4个附件中不同种类、不同产地药材的光谱具体操作如下:数据进行统计分析。通过数据建立合理的模型鉴别中药材的种类与产地,并分析红外光谱图,对未知种类与产地的中药材进首先,为每个聚类确定一个初始聚类中心,这样就有K个初行鉴定。始聚类中心;将样本集中的按照最小距离原则分配到最邻近聚对于问题1,通过使用Excel和Spss等软件处理附件1中药材类;使用每个聚类中的样本均值作为新的聚类中;重复步骤直中药材的鉴别模型以2021年全国大学生数学建模竞赛E题为例中药材的鉴别模型以2021年全国大学生数学建模竞赛E题为例四川信息职业技术学院基础教育部 伍 星四川信息职业技术学院基础教育部 伍 星722023 年 第 3 期到聚类中心不再变化;结束,得到K个聚类。我们利用SPSS软件,得到的初始聚类和最终聚类中心和四类组质心位置,以及分类的正确度,运行过程中,迭代了5次,得到4类,每类的个案数目分别为2,1,219,203。具体结果如图1所示。图3由于外界存在干扰因素,因此对附件2中的数据进行排序,将同一地区的光谱数据放一起。采用原式光谱全波段建立判别图1分析模型,11个产地的样本数据,建模结果正确率很低,说明接着,对图像信息做同一处理,纵坐标表示吸光度,横坐判别分析的受干扰情况严重,我们需要考虑数据影响。因此,标中的1表示波数652光波,2表示653光波,依此类推。利用在建立模型前,需对光谱数据进行校正和预处理。excel软件分别绘制各类药材的中红外光谱图并将光谱图进行比通过excel与spss软件聚类分析,对偏离度较高的异样数据进较。从光谱图中,直观看到每类药材的峰数、峰位、峰强、峰行剔除。再对原数据进行均匀中心化的处理,可以增强样品有形等特征都基本是一致的,契合度很强。效信息的权重,消除原始光谱数据中包含的冗余信息,突出样本光谱信号间的差异,简化所建立的近红外光谱模型并提高模型的预测能力和预测精度。光谱均值中心化是将所有样品的光谱减去平均光谱,得到的光谱分居x轴两侧。平均值公式 图2下面具体分析一下四类药材光谱图特征,分别从峰位、峰中心化公式强度、峰数、区间信息进行对比分析,如表1所示。经过去中心化后,选择11个产地的任一产地,我们选择了产地3画出原数据光谱图和去中心化后光谱图,从图中可以看出原始光谱经过处理之后光谱变得相对集中,减小了杂散光对光谱质量的影响。表1从表1中很容易得到以下信息:四类药材的峰位一致,前两类药材峰强、峰弱一致,第三、四类峰强、峰弱相似。整体峰形上,第一类在峰位1390-1861波动比较大,2088-2424峰位之间比较平缓;第二类在峰位1408-1570波动比较大,2263-图42520峰位之间比较平缓;第三类在峰位1062-1460波动比较大,判别分析方法依据是到每个类别中心的马氏距离,操作起1903-2392峰位之间比较平缓;第四类在峰位1062-1506波动比来比较简单,距离最近的为该样品的判别结果,肯定功能较为较大,1903-2392峰位之间比较平缓。因此,图像之间有明显不突出,使用这种方法需要找到较为理想的标准图谱来计算与未同,通过光谱图进行药材分类是可行的。知光谱最类似的种类,对选取的建模样品要求较高,这样才能3.2 问题2的模型建立与求解确保误判事件的发生。因此我们利用剔除异常数据的值作为样通过问题中所给不同产地中红外光谱图,可以看出,所有本,利用均值中心化处理数据结合判别分析法对6个不同产地的样品的光谱信号类似,我们通过简单的数据筛选,将附件2中的样本进行判别分析,做了两次。数据进行分产地处理,最终得到不同产地间的光谱图,我们绘制了四个图,如图3所示。由于中红外光谱信息重合严重,各样品的特征信息很难从峰强、峰弱、强信息区域、信息区域等方面直观鉴别。但是,不同产地间也存在略微的差异,比如第三、八类产地峰强最大,第七类最低,信息区强弱分段不太一致等等。我们对数据进行统计处理,分别求了11类的均值、方差、标准差,发现第图5二、七、八类的均值较大,所给样本数中,第二类相比其它产从散点图中我们可以看到,每类数据界限不够明显,因此地方差较大,整体而言数据差异性不大,所以对同种药材不同存在些许误差。我们采用三重交叉验证方法验证判别模型的预测性能。将11个产地分为3组,依次取其中1-6,4-9,6-11,利产地区分难度较大。73 技术创新用SPSS软件进行判别分析3次,使样品经历一次交叉验证,分组 本题需要参考中红外和近红外光谱数据,因此,我们利用信息及鉴别模型的结果如图6所示。Unscrambler软件分别对两类数据进行归一化分析,虽然效果不是很明显,但是还是很容易看到,归一后契合度更高。对附件3中的数据,我们首先考虑中红外光谱数据,利用软件对对原始光谱做了PCA三维和二维散点图。图6由以上分析,单独一次效果不佳,经过交叉验证,提高样图8本分析正确率达80%以上,在均值中心化下的判别分析识别法真剔除掉一些边缘化的数据,建立样本模型。用同样的方实有效,利用此方法预测,估算出给定编号药材的产地,结果法,对近红外光谱数据做同样处理,得到PCA散点图和点到中如下所示。心的距离。利用SPSS软件对17个不同产地的数据进行判别分析模型识别,分别对中红外光谱数据和近红外光谱数据做了2次分析。通过软件分析,利用测验与样本比对,我们看到,中红外3.3 问题3的模型建立与求解的识别率为77%,而中红外的识别率为91.7%。由数据可知,近红由于不同数据采集环境和方法的不同,造成了数据之间在外光谱样本识别度高,兼顾中红外光谱样本识别方法,可以作取值范围、数值大小等方面差异较大,如图7所示。为参考的依据。因此我们将问题3中的药材编号代入模型,得到如下结果。1 吴习宇.花椒产地、新陈度及掺伪的近红外光谱鉴别方法研究D.西南大学,2018.2 薛莲莲.塑料分选中近红外光谱模式识别分类的研究D.图7青岛科技大学,2020.从图中,我们可以看到数据量达,契合度不好,不利于样3 王凌,王智民,龚慕辛,等.不同产地丹参药材红外光谱分析本分析,因此,需要对原始数据进行处理。J.中国方剂学杂志.2010(5).通过数据的归一化,可以将数据进行无量纲处理,消除差4 阮晓青,周义仓.数学建模引论M.北京:高等教育出版社,异较大的数据在进行分析时的负面影响,数据归一化可以提高2005.分析的准确性,并有利于分析模型的稳健性。在本文中采用最作者简介:伍星(1993),女,四川峨眉山市人,四川大最小归一化,是对原始数据进行线性变换,设x和x 分别为manmin信息职业技术学院教师,研究方向:群论,数学教学。属性A的最大最小值,将A的一个原始值x通过最大最小归一化*映射到区间0-1中的值x,转化函数如下:【参考文献】(上接87页)推进青少年足球运动科学发展J.校园足球,2015(01):当代体育科技,2014,2(22):2-9.12.基金项目:1.2019年齐齐哈尔大学教育科学研究项目5 李伯轩.以天津市滨海新区塘沽二中心小学为例小学生(YB201954);2.2019年度黑龙江省省属本科高校基本科研业大课间体育活动方案的优化研究D.长江大学,2020.务费面上项目(135409338)。6 李淼,闫荣乐,刘连钧.天津市校园足球活动开展现状的调作者简介:许瑞冬(1999),男,天津市人,硕士研究查研究J.运动.2012,6(22):23-25.生,从事体育教育研究。7 杨东博.我国校园足球专项教师培训成效评价及优化对策通信作者:张萍(1981),女,吉林白山市人,硕士,研究D.东北师范大学,2020.副教授,硕士生导师,从事体育人文社会学研究。8 郑书斌.家庭教育方式与教育观念对天津市小学生足球兴趣的影响研究D.天津体育学院,2020.9 赵润新.天津市青少年校园足球开展现状及对策研究J.