温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
LIBS
技术
结合
机器
学习
矿石
分类
识别
方法
苏云鹏
第 卷,第期 光谱学与光谱分析 ,年月 ,基于共焦 技术结合机器学习的矿石分类识别方法苏云鹏,贺春景,李昂泽,徐可米,邱丽荣,崔晗“复杂环境智能感测技术”工信部重点实验室,北京理工大学光电学院,北京 摘要矿物分类与识别是地质研究领域的重要内容,对地质勘探和环境演化的研究具有重要意义。然而,传统的矿石分类识别方法依靠专业人员通过矿石的外形及物理性质进行人工鉴定,主观性强,准确率低,激光诱导击穿光谱技术()由于其元素“指纹”特性、灵敏度高以及快速在线检测的特点,非常适合用于地质研究领域。利用共焦激光诱导击穿光谱技术与机器学习结合,提高了矿石分类识别的精准度,利用共焦 系统获得种天然矿石样品(金矿、铜矿、银辉矿、赤铁矿、铝矿、方铅石、磷灰石以及闪锌矿)的光谱数据,采用主成分分析方法()对数据进行降维处理,并对降维后的数据采用线性判别分析()、最邻近规则()以及支持向量机()三种方法进行特征谱线的高精准分类识别。首先,采用标准铜片作为样品,对比了非共焦 系统和共焦 系统的稳定性及其对 主成分累计贡献率的影响,结果表明与非共焦 系统相比,共焦 系统的稳定性提升了 ,主成分累计贡献率提高了 ;然后,采用共焦 系统获取上述种矿石样品的光谱信息,并进行去噪等预处理,采用 对矿石特征数据进行提取,并保留累计贡献率达到 的前 维特征空间;最后,将特征数据分别与 ,以及 结合构建分类模型,进行种类识别。结果表明,方法与 和方法结合的分类准确度分别为 和 ,而与 相结合的方法,准确率可达到 。因此,采用共焦激光诱导击穿光谱技术与 和 相结合的方法,可为地质勘探和矿物识别领域提供一种快速、高准确度的分类识别方式,具有广阔的应用前景。关键词激光诱导击穿光谱;共焦 ;主成分分析;机器学习中图分类号:文献标识码:()收稿日期:,修订日期:基金项目:国家自然科学基金仪器研制项目(),民用航天技术预先研究项目()资助作者简介:苏云鹏,年生,北京理工大学光电学院硕士研究生 :通讯作者 :引言我国矿产资源丰富,种类繁多,成分结构复杂,因此,研究矿物快速、准确分类识别方法已成为地质研究领域的重要内容,同时也是地质勘探领域的必要环节。激光诱导击穿光谱技术()因其元素“指纹”特性、灵敏度高以及快速在线检测等优势,广泛应用于地质科学、工业检测、生物医学、材料科学等领域。目前,研究人员将 技术与主成分分析()方法、偏最小二乘判别分析()、软件独立建模类模拟()等多元分析方法结合,提升了 技术在各领域分类识别工作中的准确性。针对矿产资源成分结构复杂、分类识别困难等问题,国内外研究人员进行了大量研究,尤其在利用化学计量法和聚类算法辅助分析方面取得了较大进展。闫梦鸽等利用自组织特征映射网络模型训练 特征谱线,对天然地质样品中主要元素进行分类,全谱准确率达到 。杨彦伟等将非共焦 技术与强度阈值方法结合对光谱数据进行降维处理,建立最邻近规则、随机森林以及支持向量机等分类模型实现对多种天然铁矿石的快速、精确分类,精确度分别达到 ,和 。等利用树状图和最近邻识别方法结合 技术对不同地理位置的铜矿进行识别,其精确度达到 。等基于偏最小二乘回归方法建立土壤元素的 分类预测模型,实现对土壤中磷、钾、钙等元素精确分类,剩余预测偏差提升至 ,分类效果优异。通过采用共焦 技术与机器学习算法相结合的方法,实现了对种天然矿石样品(金矿、铜矿、银辉矿、赤铁矿、铝矿、方铅石、磷灰石以及闪锌矿)的快速、高准确分类识别。利用共焦 成像系统采集矿石样品的特征谱线;然后,采 用主成 分分 析方法(,)对特征谱线进行降维处理;最后,采用线性判别分析(,)、最 近 邻 分 类 算 法(,)以 及 支 持 向 量 机(,)对矿石进行分类。实验数据表明,与非共焦系统相比,采用共焦 系统,光谱稳定性提升 ,主成分累计贡献率提高 ;与 和算法结合准确度分别为 和 ,而与 算法结合准确度最高,达到 。实验部分 装置共焦 成像系统原理如图 所示,该系统采用 半导体连续激光器作为共焦显微成像系统的指示光源,使用 显微物镜(,)作为样品聚焦与谱线收集的物镜。图实验装置示意图 :压电陶瓷驱动器 :系 统激发 光 源 为二倍 频:固 体激 光 器(,),其 激 光 脉 宽 为 ,发散角为 ,频率为,最大能量为 ;脉冲光束通过显微物镜会聚到待测样品表面诱导产生等离子体光谱,并采用多通道光纤光谱仪(,)进 行 信 号 收 集,其 光 谱 分 辨 力 为 ,采集延迟时间为,积分时间为 。样品种常见的天然矿石样品作为实验样品,具体包括:金矿()、铜矿()、银辉矿()、赤铁矿()、铝矿()、方铅石()、磷辉石()和闪锌矿(),如图所示。实验开始前,首先,用蘸有无水乙醇的无尘棉签对矿石样品表面进行清洁处理,清除样品在包装运输过程中受到的污染,从而消除实验结果因污染导致错误的可能性;然后,将清洁后的样品放置于空气中,静待清洁溶液挥发干燥,完成样品预处理。在相同实验条件下,对种常见矿石样品分别进行 次脉冲激发,获取待处理 数据集。依据美国国家标准与技术研究院()的标准原子光谱数据库,对实验采集的矿石 谱线进行解谱表征。其中,金矿谱线峰位识别结果如图所示,从图中可知,金矿的 谱线密集,样本中主要含有,和 等元素。矿石中普遍存在所含元素种类丰富且不同元素特征峰位相近的特点,使得直接区分难度较大。结果与讨论 光谱预处理实验采用多通道光纤光谱仪,各通道获得的 谱线由于摄入光量和光谱特性不同,以及暗电流噪声的不同,在第期 苏云鹏等:基于共焦 技术结合机器学习的矿石分类识别方法图种矿物样品图 图金矿等离子体发射光谱图 全谱段范围出现光谱基线差异问题。因此,对 谱线进行建模分析前,需要分段校正各通道背景信号。以金矿 谱线为例,首先,利用光谱仪对背景光进行 次测量,并取平均值作为环境背景噪声信号;然后,将原始光谱数据减去背景信号,得到去除背景噪声的光谱信号;最后,为减少信号采集不 确 定 性 对 光 谱 分 析 的 影 响,对 于 背 景 去 除 后 的 谱线,将每条谱线数据取平均值作为新的光谱数据,共得到 组新的光谱数据。此外,谱线除背景噪声外,还包含由模数转换和杂散光引起的随机噪声。对去除背景噪声后的 谱线,采用窗口为的加权高斯滤波方法对随机噪声信号进行去除,高斯滤波更加强调谱峰中心强度,可以更好的保留 谱峰信息。金矿 谱线预处理操作前后的对比结果如图所示。预处理后获得每个样本各 组光谱数据,每组具有 个维度,将种样品数据合成为 矩阵,对此矩阵进行处理分析。主成分分析主成分分析方法()是一种基于多元统计分析的化学计量分析方法,其核心理论是借助于正交变换,将数据进行降维处理。共焦 成像系统的引入,极大地提高了矿石图金矿 谱线预处理操作前后对比图 特征谱线采集的稳定性,从而在主成分分析时提升特征谱线主成分累计贡献率。采用具有一定倾角的标准铜片作为样品,首先,对比了非共焦 系统和共焦 系统采集标准铜片特征谱线的稳定性。图()和()显示了在采集 组标准铜片特征谱线的条件下,非共焦 系统和共焦 系统三个光谱峰值(,)的相对标准偏差(),非共焦 系统 分别达到 ,和 ,共焦 系统 分别达到光谱学与光谱分析第 卷 ,和 ,二者 的平均值分别为 和 。根据实验结果可知,共焦 系统相比非共焦 系统,光谱稳定性提高了 。图()非共焦 系统铜片光谱阵列;()共焦 系统铜片光谱阵列 ();()其次,利用 提取并统计上述两种系统测量结果的主成分累计贡献率。如图()所示,提取前 个主成分,非共焦 系统与共焦 系统铜片测试谱线的主成分累计贡献率分别为 和 。结果表明,共焦 系统相较非共焦 系统铜片测试谱线的主成分累计贡献率提高 。图()中显示了共焦 系统采集的特征谱线前 个主成分的贡献率和累计贡献,其累计贡献率达到 ,表明前 个主成分即可代表矿石样本原始数据所具备的绝大部分特征,实现了数据降维处理。为验证特征数据的聚类效果,采用均值聚类判断特征点的聚集情况。均值聚类是无监督聚类算法,常用于快速简单聚类分析。基于 降维,在样品全谱数据 维特征空间中,获取所有特征点,并结合均值聚类构建分类模型。图()为样本点相对于前个主成分的三维得分图,种样品在空间上都明显分离,但是由于视角限制,图中仅显示视觉分离效果较明显的种样品。每个样本由对应散点展示,显示出较好的聚类效果,可以看出,代表同种矿石特征点的聚集效果优异,区分明显。图()不同系统铜片测试谱线的主成分贡献率对比;()共焦系统下种矿石主成分贡献率;()种矿石前个主成分散点分布图 ();();()三种分类算法研究通过 方法对种矿石样品的全部特征峰进行降维第期 苏云鹏等:基于共焦 技术结合机器学习的矿石分类识别方法处理后,提取前 个主成分用于表征原始数据特征,并构建特征空间。将特征空间分别与线性判别分析方法()、最近邻分类算法()以及支持向量机()三种方法结合,建立分类模型对矿石谱线进行分类识别。适用于 各 个 类 别 的 样 本数据符 合 高 斯 分布 的 情况,其基本原理是通过构建投影空间,使高维的模式样本投影到最佳识别矢量空间,满足空间中类间与类内间距比值最大化,以此区分样本类别;根据高斯权重和欧式距离计算样本特征与不同类别数据特征接近程度,以此实现分类识别;能够根据较少的样本信息在模型的复杂性和学习能力之间寻找最佳折中,使得结构风险最小化,同时获得 拥 有 较 小 的 置 信 区 间,以 获 得 最 好 的 分 类 能 力,常用的径向基核函数即为高斯核函数,可以把输入特征扩展到高维空间,适用于非线性问题分类。三种方法都属于有监督机器学习算法,需将特征空间划分为训练集和测试集两部分,通过训练集建立训练模型,再对测试集进行预测。分类准确率不仅受到样品物质成分均匀度影响,还受到训练集与测试选取比例的影响。图中八种矿物样品在不同的训练集与测试集比例下,算法的测试精度有所不同。为获取三种算法最佳测试精度,需要多次调制不同比例的训练集与测试集,进而获得更高的分类准确率。随机选取不同数量的样本作为训练集,将剩余样本作为测试集,分别统计在当前训练集与测试集比例下 、以及 分类算法的测试准确率,其中,分类方法使用 评价标准,评价参数大于,分类方法使用欧式距离,值选取为,分类方法使用高斯核函数,惩罚系数设置为,最终得到结果如图所示。图不同训练集数量下 ,和 测试精度 ,从图中可以看出在样本数为 组不变的情况下,增加训练集比例所得到的测试准确率先增后减,以及 分类算法分别在训练集数量为,以及 个时达到最佳测试准确率。因此,以及 算法中训练集和测试集最佳比例关系分别为:,:,:。采用上述最佳比例关系的样本对三种算法做分类训练,测试矿石样品特征数据,最终得到三种方法对于种矿石样品的具体测试准确率如表所示,平均准确率分别达到 ,以及 。表测试集准确率()()结论利用共焦 成像系统采集种天然矿石样品的 谱线,采用加权高斯平滑算法进行背景噪声去除;然后利用 方法对主成分数据进行提取,依次测试了 ,以及 方法在最佳训练集和测试集比例条件下的分类效果。分类结果表明,与非共焦系统相比,采用共焦 系统,光谱 稳 定 性 提 升 ,主 成 分 累 计 贡 献 率 提 高 ;和 方法的平均准确率分别达到 与 ,而 方 法 的 平 均 准 确 率 最 高,达 到 。实验结果表明共焦 技术结合机器学习算法可实现对矿石样品的快速、准确分类识别,为地质勘探领域提供了一种高效可靠的分析检测手段。,():,():,():,:,():,:,():,():光谱学与光谱分析第 卷 ,():,(闫梦鸽,董晓舟,李颖,等)(光谱学与光谱分析),():,(杨彦伟,张丽丽,郝晓剑,等)(红外与激光工程),():,():,():,():,():,:,():,():,():,():,(李昂泽,王宪双,徐向君,等)(中国光学),():,(),()“”,(,)(),(),()(),;(,;,)第期 苏云鹏等:基于共焦 技术结合机器学习的矿石分类识别方法