基于
光谱
花岗岩
长石
含量
测定
研究
新疆地质XINJIANGGEOLOGY2023年6月Jun.2023第41卷 第2期Vol.41No.2中图分类号:P619.23+5文献标识码:A文章编号:1000-8845(2023)02-291-05项目资助:自治区人才专项计划-天山优秀青年(2019Q033);新疆自治区重大科技专项(2021A03001-3);国家自然科学基金-新疆联合基金重点项目(U1803241);中国科学院重点领域部署项目(ZDRW-ZS-2020-4-2)共同资助收稿日期:2021-11-25;修订日期:2022-01-20;作者E-mail:第一作者简介:彭逸飞(1996-),男,山东章丘人,中国科学院大学地球探测与信息技术专业在读硕士,从事定量高光谱遥感地质方面工作基于高光谱对花岗岩中长石含量测定研究彭逸飞1,2,3,周可法1,3,王金林1,3,王珊珊1,3,周曙光1,3,白泳1,2,3(1.中国科学院新疆生态与地理研究所新疆矿产资源研究中心,新疆 乌鲁木齐 830011;2.中国科学院大学,北京 100049;3.新疆矿产资源与数字地质重点实验室,新疆 乌鲁木齐 830011)摘要:长石是地表岩石最主要的造岩矿物。为研究光谱分辨率及颗粒尺度对长石含量预测的影响,测定由石英、钾长石及斜长石粉末混合成的模拟花岗岩光谱信息。采用高斯响应函数重采样法,进行多光谱变换后,使用随机森林、支持向量机及极端梯度提升建模,得到钾长石及斜长石含量反演的最佳光谱宽度分别是10 nm和30 nm。依次去除矿物粒径较小样本,建模反演可得斜长石和钾长石的平均决定系数(M),分别增加0.25与0.26,表明岩石中矿物颗粒尺度越大,矿物反演精度越高。研究结论可得,基于可见光-近红外波段信息反演岩石中矿物含量。据获得的长石含量反演最佳波段宽度及颗粒尺度,为设计合适高光谱传感器进行大范围地表岩石组分检测提供参考。关键词:长石;波段宽度;颗粒尺度;含量反演;高光谱高光谱遥感在可见光-近红外波段内具多种矿物敏感特征谱带,利用这些敏感波段可定量反演矿物在岩石中的相对含量。国内外学者使用高光谱反射率数据,基于偏最小二乘法及多元逐步回归实现部分造岩矿物定量反演1-5。路鹏等对实测光谱进行包络线去除并与多元线性回归结合6,实现了Hyperion数据反演高岭石及伊利石等粘土矿物含量。有学者使用光谱库及实测高光谱数据,基于多元逐回归法实现金属矿物含量预测7-10。对矿物光谱进行分析时,前人未考虑波段宽度及矿物颗粒尺度效应对矿物定量反演的重要性,导致反演精度无法进一步提高。前人对反演模型研究侧重于传统线性模型,该类模型不能有效挖掘矿物光谱与含量间的复杂非线性关系。借鉴前人研究,本文基于实测高光谱数据,使用非线性模型进一步提高主要造岩矿物长石定量反演精度。该定量关系既能准确为研究区岩石命名又可提取矿化信息。由此提出长石反演最优光谱分辨率,以期为将来设计岩矿高精度高光谱传感器提供指标依据。1 实验部分1.1 样品采集研究区为新疆东准噶尔卡拉麦里老鸦泉-贝勒库都克花岗岩体。其中老鸦泉岩体位于卡拉麦里碱性花岗岩带最西侧,侵位于石炭系卡姆斯特组中。贝勒库都克岩体以岩株形式产出,侵入于泥盆系碎屑岩建造中11。本次采集30个新鲜岩石样品,以二长花岗岩、花岗岩与花岗闪长岩为主,矿物组合为石英、钾长石、斜长石及少量黑云母。其中,石英多呈他形粒状,粒径0.55 mm,有明显波状消光且分布不均匀,含量25%35%;钾长石多呈他形粒状,粒径0.510 mm,具条纹结构且轻度泥化,含量 30%55%;斜长石呈半自形板状,粒径0.312 mm,发育轻度绢云母化及高岭土化,含量15%40%;暗色矿物黑云母以片状为主,具明显多色性,含量低于2%,粒径0.21.5 mm(图1)。1.2 样品制备及光谱测量据镜下分析统计样本主要矿物种类。将挑选的图1 老鸦泉花岗岩显微镜下照片Fig.1 Micrograph of Laoyaquan granite(a),singlepolarization;(b),cross polarization).Mineralabbreviations:PL-plagioclase,KFS-potassiumfeldspar,QZ-quartz,BT-biotite(a)单偏光;(b)正交偏光Pl斜长石,Kfs钾长石,Qz石英,Bt黑云母新疆地质2023年样品单矿物颗粒均匀分为3份,分别研磨至4060目、100120目及180200目等3种粒度等级。挑选石英、钾长石及酸性斜长石等含量较高的3种单矿物颗粒,据采集岩石中实际矿物含量,参考深成岩定量矿物成分分类三角图(QAP)进行不同比例混合,以期配比的模拟样本组分含量更接近自然花岗岩。分别将颗粒尺度相同的3种单矿物进行混合,获得每种粒径下7个不同比例的粉末混合物。表1是21个不同矿物粉末百分含量的模拟岩石样本。使用ASD FieldSpec4光谱仪对模拟花岗岩样品进行暗室光谱测量,光谱采样间隔为1 nm,选用波长为3502 500 nm,共包含2 151个波段。在测量过程中,为避免周围反射源影响,将样品置于黑色薄片上,同时,将样品进行压平处理。光谱测量仪高密度专用探头和岩石粉末样品距离固定为10 cm。所测量岩石样品结果为反射率值,分别对样本进行5次光谱测量,用均值代表相对反射率,数据以ASCII码形式导出。2 研究方法2.1 光谱数据处理为改善光谱识别效果,对原始光谱进行光谱变换,提取多个能放大或缩小峰谷反射率值的自变量值。本文对原始光谱反射率(R)进行平方根(R)、倒数对数(ln(1/R)、对数倒数(1/lnR)及倒数(1/R)等4种变换,共获得5种光谱指标。这些变换光谱已使用在高光谱矿物及元素定量反演中,获得不错效果12-13。本文引入上述变换光谱,提取对长石含量敏感特征波段作为自变量,矿物含量作为因变量,构建高精度长石含量反演模型。将反射率光谱进行对数处理后,可避免数据偏大或偏小,同时可放大可见光波段光谱间差异14。光谱倒数变换将原始光谱值转换为相同数量级数据,使之更具可对比性15-16。对光谱反射率倒数变换再进行对数运算后可有效解决非线性问题,进一步提高可见光波段范围内光谱差异,突出光谱特征值,有效减少背景噪音对反演效果的影响17。2.2 波段宽度重采样为研究波段宽度对长石含量预测精度影响,对模拟岩石样品反射率光谱进行重采样,设置波段宽度一个变量,其余因素不变,将原始波段以5 nm、10nm、20 nm、30 nm、40 nm、50 nm、60 nm和70 nm光谱间隔进行重采样。对不同波段宽度原始光谱进行上文4种光谱变换,分别获得4个数据集。使用RF、SVM及XGBoost建立各数据集长石含量反演模型,并比较各波段宽度数据构建的长石含量反演模型决定系数R2,分析预测精度随波段宽度变化。2.3 反演方法随机森林(RF)是由Breiman提出的一种非线性智能算法,是一种不易产生过拟合问题的Bagging思想18。实质是将多棵决策树以并行方式进行集成,最后通过对决策树的回归值求平均或投票得到强分类器预测输出,使得RF模型泛化能力及预测效果显著提升。RF核心思想在于“随机”和“森林”。“随机”指的是建模样本的随机挑选及样本特征变量的随机,使得其能避免发生过拟合;“森林”表明是由多颗决策树组合形成,使得最终结果准确性更高。支持向量机(SVM)是以统计学习VC维理论和最小结构风险原理为基础发展出的一种非线性智能算法。通过采用最小结构化风险方式,使其具较好的泛化性能,并在样本数量不足、非线性及高维模式识别等难点处理上具有强稳定性。SVM的关键在于样本号KLML01KLML02KLML03KLML04KLML05KLML06KLML07KLML08KLML09KLML10KLML11KLML12KLML13KLML14KLML15KLML16KLML17KLML18KLML19KLML20KLML21矿物粒径4060目100120目180200目石英252525252525253535353535353545454545454545钾长石7563.7552.541.25018.75306555.2545.535.75016.25265546.7538.530.25013.7522斜长石011.2522.533.757556.254509.7519.529.256548.753908.2516.524.755541.2533表1 21个模拟天然花岗岩样本矿物含量说明Table 1 Mineral content description of 21 simulatednatural granite samples单位:%292第41卷第2期彭逸飞等:基于高光谱对花岗岩中长石含量测定研究最优核函数的选择,将低维非线性不可分数据映射为高维空间线性关系,计算获得最优分离超平面19。极端梯度提升(XGBoost)是由Chen等提出的基于Boosting思想的典型序列集成模型20。该模型核心原理是:将决策树基分类器引入到模型中,每引入一棵决策树时,需让模型预测残差减小,直到预测结果不再改善,最后以一定权重将引入的决策树进行集成。XGBoost在梯度提升树模型上做了两部分算法优化,第一对目标函数进行优化,进一步展开二阶泰勒式,提升了运算效率;第二,将正则项添加到目标函数中降低模型复杂程度,增强抗过拟合能力21。使用决定系数R2为评价构建长石含量反演模型的稳定性和可靠性指标。R2表示使用模型得到的长石含量预测值与实测值间的拟合优度,R2的值在01,R2越大,表示构建的模型预测效果越好,计算公式如下。R2=1-i=1n(yi-yi)2i=1n(yi-y)2(1)式中,yi第i个样本实测值;yi第i个样本预测值;y 样本实测平均值;n样本数。3 结果与分析3.1 基于最佳光谱分辨率的长石预测模型为分析反演长石矿物含量最佳波段宽度,本研究对上文8种波段宽度下的样本集均建立RF、SVM及XGBoost模型,获得每个模型的决定系数(表2)。计算每个光谱分辨率下构建的15(53)个模型的R2平均值记为N。通过比较N值分析钾长石与斜长石反演精度,N值越大,表明两种矿物反演精度越高,最高N值所对应的波段宽度就是最佳光谱分辨率。随着光谱分辨率不断下降,两种矿物N值整体上随着波段宽度的增加呈先增大后减小趋势。斜长石光谱分辨率为30 nm时,N值最大,达到0.594;钾波段宽度5nm10nm20nm30nm40nm50nm60nm70nm斜长石RFSVMXGBoostRFSVMXGBoostRFSVMXGBoostRFSVMXGBoostRFSVMXGBoostRFSVMXGBoostRFSVMXGBoostRFSVMXGBoostR0.5880.5750.5280.5820.5770.5550.5440.5640.5390.5900.5760.5850.5810.5230.5550.5780.5910.5570.5770.5760.5410.5790.5320.538R0.6100.5890.5670.5850.5630.5720.4390.5200.6080.5810.5790.5850.4470.5840.5700.4260.5630.5900.4340.5760.5420.4360.5611/R0.6190.6010.5820.5510.5660.6290.5690.5710.5340.6110.6210.5750.5740.6430.6070.5970.5740.5690.5830.6930.5930.5730.6640.554ln(1/R)0.5960.5660.6020.6060.6250.5990.5740.5830.5500.6090.5840.5970.5720.6080.5830.5670.5810.5720.5730.5870.5290.5890.5310.5641/(lnR)0.6000.5720.5850.5920.5800.5500.5670.6130.5750.6140.6120.5680.5840.6570.5440.5750.5730.5630.5490.5650.5950.5850.7090.574钾长石R0.5570.5660.5530.5470.5480.5770.5380.5170.5130.5580.6080.5760.5320.5240.5660.5490.5500.5910.5590.5170.5260.5500.5110.519R0.5510.5370.5050.5490.5110.6390.5390.5010.5350.5610.5280.6060.5580.5060.5960.5520.5250.6060.5550.5240.5390.5560.5270.5461/R0.5540.6330.5680.5340.5700.5950.5060.5220.5690.5440.5460.5660.5530.6000.5540.5310.5800.6100.5600.5680.5720.5190.5790.539ln(1/R)0.5600.6120.5640.6000.5930.5840.5120.5470.4980.5620.5730.5990.5520.6100.5420.5410.6020.6030.5570.5780.5480.5790.6000.5641/(lnR)0.5640.5610.5740.5350.6290.5550.5190.5500.5140.5700.6120.5420.5450.5870.5740.5420.5690.5850.5660.5010.5570.5750.6280.562表2 斜长石和钾长石在不同变换光谱及建模方法下的反演结果Table 2 Inversion results of plagioclase and potassium feldspar under differenttransformation spectra and modeling methods293新疆地质2023年长石光谱分辨率为10 nm时,N值最大,为0.571。由此看来,针对两种长石矿物,不是光谱宽度越小,整体预测结果越好。也不是光谱宽度越大,预测结果越好。相对偏低的光谱采样间隔可达到最优预测结果。造成这种现象的原因可能是长石光谱特征较宽,对反射率进行光谱转换后突出了特征谱带,降低了波段宽度增大而消除的峰谷特征对长石反演的影响。此外,相对大的宽波段使光谱信噪比增加,以至整体反演效果增强。表明未来针对花岗岩类岩石矿物设计高光谱传感器时,如仅从波段宽度角度考虑,可不必过高要求分辨率。3.2 矿物粒径对长石定量反演的影响基于21组模拟花岗岩样本全波段光谱信息,依次去除180200目筛及100120目筛粒径样本,得到3个原始反射率光谱样本集。对上述3个新样本集进行光谱变换及模型反演操作,分别获得15个决定系数值(表3),计算每个样本集下15个R2的平均值记为M。据M值变化,发现不同颗粒尺度对长石含量反演效果的影响。在全粒径样本中,两种长石平均决定系数M值略高于0.6,这可能是因钾长石与斜长石在可见光-近红外范围内存在部分相近的光谱特征,特征波谱相互干扰使得整体的反演精度较低。相比3种粒径样本的建模精度,删除最小粒径180200目筛后,钾长石与斜长石的反演模型 M 值均升高约0.15;进一步删除次小粒径100120目筛样本后,两者M值继续增加0.1左右。由此看出,利用较小矿物粉末粒径模拟的天然花岗岩样本,定量反演长石含量的精度较差。该结论说明,矿物粒径尺度的不同使得光子散射和吸收发生了不同程度地变化,两种长石粒径尺度越小,与内部光学路径比较,将使模拟岩石粉末样品表面反射成一定倍数的提高,导致钾长石与斜长石的特征光谱反射率值整体升高,使得总体预测精度下降。4 结论与展望从采集的花岗岩样品中挑选石英、钾长石和斜长石粉碎为3种粒径,将同粒径粉末混合模拟天然花岗岩。各矿物颗粒尺度下分别配比了7组模拟天然花岗岩样本,并基于可见光-近红外光谱仪测得模拟天然花岗岩在3502 500 nm的光谱反射率。分别探讨基于多种光谱变换及建模方法,波段宽度与颗粒尺度对钾长石与斜长石反演精度的影响。从实验结果可知,不是波段数越少,光谱间隔越大,反演精度就越低,当波段宽度为30 nm时斜长石预测效果最好,当波段宽度为10 nm时,钾长石具理想的拟合效果和可靠的预测能力。通过依次去除粒径最小(180200目)及次小(100120目)的样本,钾长石与斜长石的预测精度均有显著的提高;当仅包含4060目筛的样本时,两种长石矿物的反演精度最高,矿物样本全部粒径删除180-200目样本删除100-120和180-200目样本斜长石钾长石斜长石钾长石斜长石钾长石RFSVMXGBoostRFSVMXGBoostRFSVMXGBoostRFSVMXGBoostRFSVMXGBoostRFSVMXGBoostR0.6090.6600.5820.5610.7030.6090.8060.8250.7730.7970.8250.6860.8910.9120.8530.8850.9100.818R0.6170.6880.5510.5630.7470.5760.8270.8370.7850.8070.8050.7200.9050.9340.8260.9150.8650.8121/R0.6360.7230.6210.5790.6950.5950.8420.8130.7780.8150.7810.7050.9220.9140.8190.9190.9640.843ln(1/R)0.6410.7170.6090.5650.6520.5990.8550.8590.7880.8370.7540.7210.9170.9230.8850.9350.9230.8301/lnR0.6290.7370.6160.5720.6770.5860.8190.8000.8020.8220.8000.7010.9130.9290.8190.9160.8900.807表3 删除不同粒径尺度样本对模型的影响结果Table 3 Impact results of deleting samples with different particle sizes on the model294第41卷第2期彭逸飞等:基于高光谱对花岗岩中长石含量测定研究粉末粒径越小使得反演精度越低。此研究既可对花岗岩中长石进行定量反演,又能作为其他岩石矿物含量反演的依据与参考,有利于为今后基于高光谱进行大范围的地表各类岩石命名提供可行性。本文模拟的花岗岩仅包含矿物含量较高的石英及长石,未体现出暗色矿物黑云母对长石预测精度的影响。下一步将暗色矿物黑云母加入到样本中,分析其对长石反演精度的影响,尝试建立定量反演黑云母的最佳模型。本研究于条件理想的室内采集光谱,若应用于大范围的室外地表岩石矿物含量反演,还需考虑很多因素,如太阳光入射角、传感器方位、岩石表面粗糙度以及岩石风化程度等。因此,将所建立的最优参数模型应用于高光谱图像上还有待进一步探讨,也是今后主要研究工作。参考文献1Ling ZC,Zhang J,Liu JC.Preliminary results of data TiO2 inver-sion of Change-1 interferometric imaging spectrometerJ.Chi-nese Science Bulletin,2011(16):1257-1263.2Yang CB,Zhang C,Liu F,et al.Study on the Relationship be-tween the Depth of Spectral Absorption and the Content of theMineral Composition of BiotiteJ.Spectroscopy and SpectralAnalysis,2015,35(9):2583-2587.3田夏一.基于多源遥感数据的月表物质组分含量反演方法对比分析D.中国地质大学(北京),2018.4杨长保,高文博,侯光宇,等.火成岩中长石含量与其特征光谱间响应关系研究J.光谱学与光谱分析,2019,39(7):2077-2082.5高文博.基于Hyperion数据的新疆东天山地区长石含量反演D.吉林大学,2020.6路鹏,周超,陈圣波,等.基于Hyperion数据的江西德兴矿区粘土矿物信息提取及其找矿意义J.地球科学-中国地质大学学报,2015,40(8):1386-1440.7张琴.地表岩石中Fe2O和SiO2的遥感定量反演研究D.吉林大学,2013.8成功,唐婕,袁海明,等.先验知识在堆积型铝土矿定量遥感反演中的应用J.轻金属,2017,(4):4-8.9成功,钟超岭,袁海明,等.基于样本数据的红土型铝土矿定量遥感建模与反演研究J.地学前缘,2019,26(4):109-116.10 秦凯,陈建平,赵英俊,等.航空高光谱地表氧化铁矿物含量评估技术J.遥感信息,2019,34(1):1-6.11 陈言飞.新疆卡拉麦里与A型花岗岩有关锡矿的地质特征和围岩蚀变D.中国地质大学(北京),2013.12 刘苗,蔺启忠,王钦军,等.基于反射光谱的铜元素地球化学异常研究J.光谱学与光谱分析,2010,30(5):1320-1323.13 Yang CB,Liu N,Kuai KF.Research on Relationship betweenSpectral Character-istics,Physical Parameters and Metal Ele-ments of Rocks in Xingcheng AreaJ.Spect-roscopy and SpectralAnalysis,2019,39(9):2953-2965.14 王昶,黄驰超,徐光辉,等.近红外光谱结合偏最小二乘法快速评估土壤质量J.土壤学报,2013,50(5):36-45.15 王金凤,王世杰,白晓永,等.基于高光谱反射率的喀斯特地区土壤重金属锌元素含量反演J.光谱学与光谱分析,2019,39(12):3873-3879.16 Zhao H,Feng X,Xiao P.Contour extraction of green cover alongurban roads from remote sensing imagery based on frequency do-main featuresJ.Remote Sensing Information,2014,29(3):50-56.17 张东辉,赵英俊,秦凯,等.光谱变换方法对黑土养分含量高光谱遥感反演精度的影响J.农业工程学报,2018,(34)20:141-147.18 BreimanL.Random ForestsJ.MachineLearning,2001,45(1):5-32.19 顾亚祥,丁世飞.支持向量机研究进展J.计算机科学,2011,38(2):14-17.20 Chen T,Guestrin C.XGBoost:A Scalable Tree Boosting SystemC.Proceedings of the 22nd ACM SIGKDD International Confer-ence on Knowledge Discovery and Data Mining.ACM,2016:785-794.21 Liu B,Shuo Y,You HL,Dong Y,et al.Road surface temperatureprediction based on gradient extreme learning machine boostingJ.Computers in Industry,2018,99.Study on Determination of Feldspar Content in Granite Basedon HyperspectralPeng Yifei1,2,3,Zhou Kefa1,3,Wang Jinlin1,3,Wang Shanshan1,3,Zhou Shuguang1,3,Bai Yong1,2,3(1.Xinjiang Research Center for Mineral Resources,Xinjiang Institute of Ecology and Geography,Chinese Academy ofSciences,Urumqi,Xinjiang,830011,China;2.University of Chinese Academy of Sciences,Beijing,100049,China;3.Xinjiang Key Laboratory of Mineral Resources and Digital Geology,Urumqi,Xinjiang,830011,China)Abstract:Feldspar is the main rock forming mineral of surface rocks.In order to study the influence of spectral resolu-tion and particle size on the prediction of feldspar content,the spectral information of simulated granite mixed withquartz,potassium feldspar and plagioclase powder was measured.Gaussian response function resampling method is usedfor multispectral transformation,and random forest,support vector machine and extreme gradient boosting are used formodeling.It is obtained that the optimal spectral widths of potassium feldspar and plagioclase content inversion are 10nm and 30 nm respectively.In addition,in order to remove samples with smaller particle size,the average coefficient ofdetermination(M)of plagioclase and K-feldspar increases by 0.25 and 0.26 respectively,indicating that the larger themineral particle size is,the higher the accuracy of mineral inversion is.It can be concluded that the content of minerals inrocks can be retrieved based on the visible near-infrared band information,and the optimal band widths and particle sizecan be retrieved according to the obtained feldspar content,which provides a reference for designing a suitable hyper-spectral sensor for large-scale detection of surface rock components.Key words:Feldspar;Band width;Particle size;Concentration inversion;Hyperspectral295