温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
红外
光谱
结合
CA
SDP
eNet
木材
种类
识别
研究
刘思岐
第 卷,第期 光谱学与光谱分析 ,年月 ,中红外光谱结合 的木材种类识别研究刘思岐,冯国红,唐洁,任加祺东北林业大学工程技术学院,黑龙江 哈尔滨 上海宇航系统工程研究所,上海 摘要光谱分析在木材种类识别领域具有一定的潜力,而其中的中红外光谱也广泛应用于定性及定量分析。该研究中红外光谱法识别木材种类的报道中,基于深度卷积神经网络可以在参数较少的条件下获得较高的识别率。提出了一种聚类分析()、对称点阵图像分析()与深度学习()相融合的算法,利用 的优势提高中红外光谱法识别木材的准确率。首先,采集了愈疮木、巴里黄檀、刺猬紫檀、大果紫檀、螺穗木种木材样本的 组中红外光谱数据,应用欧式距离进行了异常值剔除,剩余 组作为待分析数据并对其进行分类的可行性分析。对光谱数据进行 转化分析,确定 转化的最优参数;之后,运用 筛选原始光谱数据的特征,根据 不同阙值确定了三组维数的特征并进行讨论,通过对比三组特征数据经过 转化后图像间的类内相似性和类间差异性,初步确定了最优维数特征;再将初步确定的最优维数特征数据输入到 模型中,获得模型识别的准确率;最后通过对比分析验证了模型的有效性,一方面将原始数据及其余两组对照维数的特征数据分别输入到 模型中,对比识别的准确率;另一方面以最优维数特征数据输入到随机森林中进行识别,对比传统机器识别与 算法识别的准确率。结果表明:经 特征筛选的 模型普遍高于原始数据直接输入到 模型的准确率,特征筛选最优维数为 维,其测试集最高识别率达到了 ,而对照组 维为 ,维为 ,原始数据的 模型识别率仅为 ;经 特征筛选的最优维数数据对应的随机森林模型识别率较低,仅为 。因此,提出的 模型能有效提高中红外光谱法识别木材种类的精度。关键词中红外光谱;木材种类识别;聚类分析;对称点阵图像分析;深度学习中图分类号:文献标识码:()收稿日期:,修订日期:基金项目:中央高校基本科研业务费专项资金项目(),国家自然科学基金面上项目(),黑龙江省自然科学基金项目()资助作者简介:刘思岐,女,年生,东北林业大学工程技术学院硕士研究生 :通讯作者 :引言在我国经济飞跃式增长的大背景下,各类木制品行业也在迅速发展,因此对木材的需求也呈现逐步上升的趋势。目前中国的木材贸易现状为补充性进口贸易,进口木材占比达到了 左右,其中进口木材的品种繁多,木材种类来源较为复杂,一旦市场规模庞大,就容易出现逃避关税、以次充好等贸易欺诈行为。新形势下,准确地鉴别木材种类对于更好的稳定市场和保护消费者利益具有更实际的意义。光谱技术因具有便捷、快速、不破坏样品,不需要化学试剂,不污染环境等优点,越来越受到青睐。近年来,学者们对中红外光谱技术的应用也进行了大量的研究,冯宇等利用中红外技术对茶叶种类建立以主成分分析和马氏距离相结合的识别模型,以此对四种不同产地的茶叶进行分类研究,进一步为中红外技术的应用提供了依据,为此,本研究主要针对中红外光谱法识别木材种类的算法进行了探索,以拓展木材种类识别的手段。分析红外光谱法识别木材种类的算法,目前主要集中在先进行光谱特征提取,之后再通过传统分类算法如 神经网络、支持向量机等进行分类研究,上述方法虽然获得了较高的识别精度,但是在训练时参数过多,分类种类有限,效率低。深度学习算法可以自主提取特征,在参数较少的条件下能够获得较高的分类效率,成为了近年来的研究热点。等 利用对称点技术()将轴承振动信号转化为极坐标图像,之后利用深度学习中的卷积神经网络对轴承故障进行诊断识别,为一维数据与深度学习的结合提供了思路。因此本研究基于深度学习的 算法优势,利用对称点技术()将一维光谱序列数据转化成二维图像数据,再利用 的优势进行木材种类识别,为红外光谱法识别木材种类提供新的思路。与此同时,分析红外光谱的类别识别研究,发现聚类 特征筛选表现出了一定的优越性,胡善科 等利用聚类分析()对烟叶光谱数据以不同参数进行特征筛选,将得到的特征取并集,之后利用局部保持投影()对并集特征进行降维,最终的分类准确率达到 。因此,本研究应用 时又结合了 进行了中红外光谱特征筛选。以进口的愈疮木、巴里黄檀、刺猬紫檀、大果紫檀、螺穗木为研究对象,用中红外光谱仪采集种木材的光谱数据,对数据进行异常值剔除,运用 提取光谱数据的特征,再利用 将光谱特征数据转化成二维图像数据,对转化后的图像进行随机划分,确定训练集、验证集和测试集,对训练集和验证集进行旋转、裁剪等数据增强操作,进而基于 进行分类识别,并与原始光谱数据的 图像及常用的随机森林模型进行对比,验证算法的有效性,以期为中红外光谱法识别木材种类提供更精准的算法支撑。实验部分 仪器与数据采集实验是在黑龙江出入境检验检疫局进行的。采用的中红外光谱仪是美国的 傅里叶中红外光谱仪,采集的波数范围为 ,采集软件是 。木材样本包括愈疮木、巴里黄檀、刺猬紫檀、大果紫檀、螺穗木共种,对木块进行打磨确保木块表面光滑无毛刺,得到 的木块。每类木材样本为 块,将每一个木块横向均等分割为个区域,取每个区域的中心点进行光谱数据采集(见图),每个中心点采集次,以次的平均值作为该中心点的光谱数据,共计获得 组。图像转化 图像转化最初是为了将时域信号转化成图像,使得波形不同的信号数据转换为差异性明显的可视化图形。在原始数据集中,为点的纵坐标值,为点的纵坐标值(为离散序数,),将和通过 转化公式转化为极坐标中 的 点(),(),(),(),其中转换为极坐标中的半径(),则转换为极坐标中的角度,即()和()。的转化公式为()()()()式()中,和 分别为数据集中纵坐标的最小值和最大值,()和()分别为沿着极角为零的线逆时针和顺时针偏转角度,为取值间隔,为放大倍数,为对称旋转角(,),通常取,即取 ,也就是雪花图。图木材样本的光谱数据采集 聚类特征筛选光谱波数范围为 ,共 维数据,其中过多的相似性数据会导致 图像的类内间距过大,而类间间距过小,要想使各木材种类间的图像差异性增强,就需要对相似性的干扰数据进行剔除。采用聚类的思想,通过考虑分类过程中的类间差异与类内相似这两项指标,筛选出最优特征。在同类木材中不同样本某一维波长数据的相似性高,则代表该维数据更加聚集,这样的数据就更优,也越应该保留。令第类的第个波长点的标准差为(),利用个波长点求得类内阙值(),计算式见式()。类内阙值越小,类内相似性越高,式()中,通过调整参数可筛选出最优的类内特征。()()()()()对于类间来说,令种木材种类在第个波长点的标准差为,通过对该波长点的每一类木材种类的类内标准差求标准差即类间阙值,计算式见式()。类间阙值越大,说明该特征对应的类间数据差异性越大,越应该保留这个特征,式()中,调整参数可筛选出最优的类间特征。()()()()通过对每个波长点进行类内取值和类间取值,就可以得到最优的分类特征。模型 模型的网络结构如图所示。在 网络中,主要采用 这一核心结构,使得神经网络中的任意两层之间都有直接连接,即网络中每一层的输入都是第期 刘思岐等:中红外光谱结合 的木材种类识别研究所有前层输出的并集,在这一层学习到的特征也将作为输入直接传递给后续的所有层。经过实验验证表明,模型不仅能够提升目标分类准确率,还能有效防止梯度弥散。本研究采用经典模型 进行迁移学习。图 的网络结构 图各木材的原始光谱图():愈疮木;():巴里黄檀;():刺猬紫檀;():大果紫檀;():螺穗木;():类木材光谱图 ():;():;():;():;():;():光谱学与光谱分析第 卷结果与讨论 异常样本剔除采用欧氏距离对采集的 组光谱数据进行了异常值剔除,以确保数据的可靠性。维空间中的欧氏距离计算如式()所示。(,)()(,)()式()中,(,)表示在维空间中的点(,),(,)之间的距离。欧式距离是通过选择合适的阈值对数据中不满足阈值的点进行剔除的方法,距离阈值设置为,意味着通过对维空间中的点进行式()中的距离计算并对其排序,剔除排序最后的两个样本。剔除后每类木材的样本数由 个减少到 个,样本总数由 个变为 个,后续的数据集均以该 个数据为分析基础。剔除异常值后的原始光谱图对各木材的原始光谱进行异常值剔除后的光谱图如图所示,其中,图()为类木材的对比光谱图。从图中的()()可以看出,每类木材的光谱图整体均相似并且其自身重叠度都较高,即拥有较好的类内相似性。从图()来看,类木材的光谱图差异也较明显,主要体现在各木材的吸收度的不同,尤其在光谱的各个波谷处的差异性达到最高,但直接分类识别还存在一定的难度。因此需要加大 各 木 材 间 的 差 异 性,并 同 时 增 大 木 材 的 类 内 相似性。图像转化 参数选取在 转化过程中,参数的选取至关重要。在参数选取时,应综合考虑不同木材种类之间的图像差异性及同种类木材间的相似性。盲目追求不同木材种类之间的图像差异性,会造成同种类木材种类间图像差异性也偏大,最终导致木材分类识别效果不理想。在调整参数时应尽量保证 图像能占满整个坐标系,并且图像不出现重叠。对转化式()中的取值间隔和放大倍数进行了讨论,令分别取值为,和,分别取值为,和,对称旋转角取 ,对种木材种类的 个光谱数据(波数范围 ,共 维)进行 变换,部分结果展示如表和表所示。表愈疮木的 转换结果 表和表分别是愈疮木和巴里黄檀在不同取值间隔和放大倍数时获得的 转化图像,由表和表可以看出:()当取值间隔时,图像主要是由 条线组成,此时愈疮木和巴里黄檀相同参数下的 图像并未看出任何不同,随着取值间隔的增大,相同参数下愈疮木和巴里黄檀的 图像差异性逐渐增大,图像特征也越来越明显。当 时,愈疮木和巴里黄檀的 图像特征最明显,差异性显著。()当放大倍数 时,图像并未铺满整个坐标系,而随着的增大,图像开始旋转,当 时刚好相交,此时愈疮木和巴里黄檀的 图像并未出现重叠,在 时图像开始出现重叠。第期 刘思岐等:中红外光谱结合 的木材种类识别研究表巴里黄檀的 转换结果 对比表和表中愈疮木和巴里黄檀的 图像特征,考虑到图像特征太过明显会造成同类木材类内差异性过大的问题,此处不推荐 作为取值间隔。此外,重叠部分过多会影响图像特征,进而影响图像分类识别的准确率。当 和 时,图像刚好铺满坐标系,图像特征表达清晰,且此时图像中图形臂正好相交,愈疮木和巴里黄檀的 图像也有明显差异性,因此 图像转化的参数选取为 和。转化以上述中确定的 和 为 研究参数,对木材种类间差异性和木材种类内相似性进行讨论。木材种类间差异性:对比类木材的 转化结果,如表所示。由表可以看出,愈疮木和刺猬紫檀表现出了与其他木材种类图像存在显著的差异性,重点表现在点的聚集区域不同。但巴里黄檀、大果紫檀和螺穗木的 图像较相似,未能达到不同种类之间的差异性要求,不利于后续分类识别。木材种类内相似性:在讨论类内相似性时,以愈疮木为例,对原始数据转化后的 图随机选取个样本,结果如表所示。由表可以看出,随机选取愈疮木的个样本间的 图像之间相似度较高,能够满足类内相似性的要求。综上,各木材种类之间的 转化图像整体较相似,其中表中愈疮木的个随机样本的 图像和表中的巴里黄檀、大果紫檀和螺穗木的 图像相似性极高,类间差异性低,不利于木材种类识别。表类木材种类 维 图像 聚类特征筛选考虑到光谱维数过高,使得木材种类之间共性特征过多,导致获得的光谱图像整体上过于相似。因此有必要对光谱数据进行特征筛选,删除干扰数据保留特征数据。选取聚类分析算法对光谱数据进行特征筛选。对聚类运算中的类间阙值和类内阙值进行了不同取值的探讨,以获取最佳光谱特光谱学与光谱分析第 卷表愈疮木的个随机 图像 表类木材种类的聚类特征筛选后 图像对比 表愈疮木的个随机 图像聚类特征对比 第期 刘思岐等:中红外光谱结合 的木材种类识别研究征组合。令组:类间阙值 ,类内阙值 ,特征数提取为 维;组:类间阙值 ,类内阙值 ,特证数提取为 维;组:类间阙值 ,类内阙值 ,特征数提取为 维。对三组参数分别提取的特征进行 转化,得到类木材的转化结果如表所示,得到同一木材种类(以愈疮木进行展示)次随机抽样的转化结果如表所示。由表可以