温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
鞍山
尾矿
土壤
重金属
含量
光谱
反演
贾玉娜
鞍山式铁尾矿区土壤重金属含量高光谱反演贾玉娜,董元,白洋,刘暑明,李孟倩(华北理工大学,河北 唐山 063210)摘要:土壤中的铜浓度占比过高会对人体和环境造成一定的危害,因此探讨重金属铜含量反演具有重要意义。本研究以唐山典型铁尾矿区 43 个土壤样品为例,同时测定土壤中铜的反射光谱和含量信息,经多种波谱变换后,通过相关性分析法(CA)和连续投影法(SPA)进行土壤铜含量的特征波段选取,然后利用多元线性回归(MLR)和偏最小二乘回归(PLSR)算法建立了铜含量的反演模型,得到多种光谱数据的反演成效。结果显示:二阶微分处理后的光谱数据,其反演效果较好,CA-PLSR 和 SPA-MLR 两种反演模型中,SPA-MLR 的反演精度相对较准确;二阶微分光谱变换后的 SPA-MLR 模型在估算土壤铜含量方面更有优势。关键词:高光谱;铜;特征波段;反演doi:10.3969/j.issn.1000-6532.2023.02.032中图分类号:TD951;P237 文献标志码:A 文章编号:1000-6532(2023)02021306 我国铁矿资源丰富,铁尾矿成分各异,铁矿山排出的尾矿成分差别很大,排除少量金属组成成分外,其他基本矿物组成涵盖绿泥石、方解石、石英、赤铁矿和黄铁矿等。河北省是尾矿库大省,总数量在全国第一,河北省尾矿库数量在2400 座左右。唐山铁尾矿多属于高硅鞍山型铁尾矿,其特点是 SiO2含量高达 70%左右,高硅鞍山式铁尾矿是全国数量最大的一类尾矿类型。有关国家土壤的污染统计情况显示,金属矿区及矿业废弃地周边土壤铅、砷等重金属污染严重1。尾砂浆中含有多种重金属,其在环境中不易降解并能在动植物体内富集,这些金属一旦通过外排废液或者扬尘进入大气、水和周围土壤中,就会导致严重的污染和危害。近年来,许多研究者通过地球化学检测2、电化学方法3、激光诱导击穿光谱技术 4、电镜扫描技术5等方法进行了重金属污染方面的研究,并在特定的研究环境下得到了一定的效果。近年来,高光谱以其高效、快捷、节约成本、非破坏性的新技术优势广泛用于土壤重金属含量测定中,为更加精准、普适的进行土壤重金属研究提供了一条新路径6。“十二五”以来,国家对受关注度极高的尾矿库重金属污染的治理给出了更明确的要求,使其成为目前解决环境污染问题的一大热点。如何准确快速地获取尾矿中重金属污染分布情况是进行污染风险评价及预测研究的首要问题。唐山作为矿产资源丰富的矿业城市,每年尾矿的产出量很大,但关于唐山铁尾矿的重金属污染研究目前尚未报道,部分学者只是针对鞍山式铁尾矿 Fe、Si等化合物的含量研究7-8。因此,本文在对唐山典型尾矿区土壤进行 As Cr Cd Ni Zn Cu Pb Hg 8 种典型重金属元素测定后,以中国土壤元素背景值为参照,发现铜的含量高于土壤背景值,可能存在铜元素重金属污染,由此对铜元素进行含量与光谱的特征波段选择,筛选出铜的特征波段,利用偏最小二乘法和多元线性回归法建立土壤重金属反演模型,以期为高硅鞍山型铁尾矿土壤重金属污染提供理论支撑。1材料与方法 1.1研究区概况本研究区域主要分布在司家营铁尾矿库及其 收稿日期:2021-02-16基金项目:河北省教育厅青年基金(QN2020149);河北省省属高等学校基本科研项目(JQN2019008);华北理工大学博士研究生创新项目(CXZZBS2020142);华北理工大学青年基金(Z201618)作者简介:贾玉娜(1986-),女,讲师,博士生,主要研究方向为遥感与地理信息应用。第 2 期矿产综合利用2023 年 4 月Multipurpose Utilization of Mineral Resources 213 周边土壤地区,即位于唐山市滦县下康各庄。此尾矿库为正在使用中的尾矿库,库内尾砂浆主要由司家营铁矿场经高压泵输送至此,目前尾矿库的最高坝为 19 期坝,平均 3 年进行 2 期筑坝,本次采样点分布以主坝的坝顶为中心向四周发散取样,尾矿库内采样点分别选取坝顶、坝坡、坝底,尾矿坝周边土壤以尾矿库为中心选取东、西、南、北四条采样路线,对周边的村庄、农田、林地、梯田、果园等不同地类进行采样。1.2样本处理与理化分析 1.2.1样本采集司家营尾矿库坝及其周边为采样区,依据发散线布点法开展采样工作,于坝顶、坝坡、坝底以及尾矿库四周采集土壤样本。其中尾矿库共取样 4 个,沿东、西、南、北四条发散线采用 S 型取样 43 个,除尾矿坝样本外,其余均为表层(030 cm)的土样,采集量大约 1 kg 左右,装入黑色自封袋,通过手持 GPS 定位每个采样点,编辑相应编号贴于自封袋上,对每个采样点进行拍照,并记录周围的土地利用类型、土壤性状、植被覆盖情况等信息。每个采样点土壤样品分为2 部分,其中,一部分用来进行化学元素测定,另一部分用来进行光谱研究。1.2.2样本理化成分测定将测量光谱后的土壤样本使用分析天平依次准确称取 4 mg 样品,样品转移至聚四氟乙烯消解管中,向样品消解管中滴入 3 mL 硝酸、3 mL 盐酸、0.5 mL 氢氟酸,经电加热板进行加热消解。消解时需要在消解液小于 2 mL 时按 11 的比例补加硝酸和盐酸。消解完成后,将消解管放入通风橱内进行自然冷却至室温,将消解好的样品过滤并使用去离子水稀释定容至 10 mL 的容量瓶中混合均匀,每批样品加做双份全程试剂空白对照实验,采用电感耦合等离子体质谱仪(ICP-MS)测定重金属铜元素含量,其中每个样本平行测量两次,选取平均值作为最终的含量。1.3土壤光谱处理在实验室内使用 Field Spec 光谱仪在 3502500 nm 光谱范围内进行土壤光谱信息的获取。具体操作为:将野外采集的土壤样本剔除其中的根系、枝叶、石块等,经风干处理,于 85 烘箱内烘干 3 h,用球磨机磨细并过 0.15 mm 筛子。将土样放置在 583 cm 的黑色纸盒内,探头垂直对准被测土壤的中部,光源用光谱仪自带光源。为了准确测量样本,需先进行白板定标,再经按压土壤表面后开始测量,对各样本重复测量 5 次后,求其算数平均值为该样本的实测光谱数据。为了削弱测定过程中仪器、光照等条件的影响,对原始光谱曲线进行断点修正和 Savitzky-Golay 平滑处理,同时为了凸显土壤光谱反射率特征,提高反演精度,对土壤光谱反射率进行了光谱一阶微分(FD)、二阶微分(SD)和光谱连续统去除光谱变换(CR),增强有效波谱信息。1.4特征波段选择方法 1.4.1相关性分析法r相关性分析法(Correlation Analysis,CA)是研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法。相关系数是衡量变量之间的相关程度,一般用字母 表示,用来度量两个变量间的线性关系。r(X,Y)=Cov(X,Y)VarXVarY(1)其中,Cov(X,Y)为 X 与 Y 的协方差,VarX 为 X 的方差,VarY 为 Y 的方差。经多次实验后选择相关性最高的前 70 个波段进行反演效果较佳。1.4.2连续投影法连续投影法(Successive Projections Algorithm,SPA)是由 Araujo 等提出的一种消除变量间共线性的波段选择算法,该方法是提取全部光谱的一些特征波段来消除原始光谱中的冗余信息。其主要原理算法如下。Xnpsl=s1,s2,.,sm Rpmm M=min(n,p)i=1k=1,2,.,pzi=xksk1=xksl(k,1)=ku=1,2,.,mziInn将光谱矩阵进行分组,分为 p 组,设为集合。每组选择 m 个波长。令,;,。基于 构建正交投影算子。其中 为的单位矩阵;Pi=Izi(zi)T(zi)Tzi(2)vv 1,p&v slskv=pixvskv将剩余还未被选入的波长矢量的集合记作,即为;。计算各 的正交投影矢量,并得到波长位置,即sl(k,u)=argmaxv1,p&vslskv;zi=xsl(u)(3)i=i+1i 2.5 时,模型具有超高的估算准确度;当 2RPD2.5 时,模型具有高度的反演准确性;当 1.8RPD2 时,模型具有较高程度的反演准确性;当 1.4RPD1.8 时,模型具有一般高度的反演准确性,但仍在可以接受的范围内;当1.0RPD1.4 时,模型具有较低高度的反演准确性;当 RPD1.0 时,模型的反演精度极低已经不能满足研究需求9。综合模型情况来看,R2和RPD 值最大、RMSE 值最小时为较优估算模型。2结果与分析 2.1土壤样本重金属含量分析本次采集的尾矿库及周边 43 个土壤样本铜含量的结果见表 1。表 1 铁尾矿区尾砂土壤重金属铜含量分析/(mgkg-1)Table 1 Analysis of heavy metal copper content in tailing soilof iron tailings area样本均值最大值最小值标准差变异系数Cu11.8025.054.494.0734%在土壤的相关研究中,变异系数可作为反映土壤样本变异程度的等级划定指标,如表 2 所示,由变异系数来看,铜元素处于 16%35%的中等变异区间;如果变异系数太大的话,说明有差别大的样本值,会对后面的模型建立的精度产生影响,这时候就要根据实际情况进行剔除,本次采集样本不需要剔除。表 2 土壤变异系数等级分类Table 2 Classification of soil coefficient of variation系数区间等级0 15%小16%35%中36%高 2.2土壤实测光谱曲线分析矿区土壤样本(43 个)在可见光-近红外波段区间的波谱曲线见图 1。各土壤样品的光谱曲线形态特征呈现相同的特点,但因土壤组分存在差异,致使土壤光谱反射率高低不一。在可见光波段,土壤反射率较低,但增速较大,在 760 nm 之后近红外波段,反射率变化趋势总体较为平稳。在 1400、1900 和 2200 nm 处出现明显的吸收波 400800120016002000240000.10.20.30.40.50.60.7反射率波长/nm图 1 土壤样本反射率光谱曲线Fig.1 Reflectance spectrum curve of soil samples 第 2 期2023 年 4 月贾玉娜等:鞍山式铁尾矿区土壤重金属含量高光谱反演 215 谷,主要是土壤粘土矿物和硅酸盐类矿物中所含的水分子所致。2.3土壤重金属含量反演分析偏最小二乘回归(partial least squares regression,PLSR)建模方法,通过考虑光谱数据与性质之间的内在联系,模型更加稳健,但模型建立过程复杂、抽象,计算速度较慢且繁琐。当变量之间相关性非常高时,PLSR 效果极佳。而多元线性回归(multiple linear regression,MLR)常用于线性较好的数据,产生的模型比 PLSR 更简单,更容易解释。故本文基于相关性分析法所选取的特征波段数量较多、相关性较好,通过建立 PLSR 模型分析其预测能力,基于连续投影法得到的特征波长线性较好,通过构建 MLR 模型分析其预测能力。2.3.1CA-PLSR 反演根据 CA 筛选的敏感特征波段,经偏最小二乘回归分析建立土壤铜含量的反演模型,其建模和验证结果见表 3,其中 SD 建模的 RC达到了 0.94,RMSEC 为 0.75 mg/kg,其验证模型的 RP、RMSEP和 RPD 值分别为 0.68、3.41 mg/kg 和 1.78,此模型拟合的稳定性相比较适合。其他模型中 R、FD 和 CR 的验证误差均大于 2,RPD 值分别为1.07、1.22、1.07,这 3 种模型精度不够理想。表 3 土壤铜含量 CA-PLSR 模型结果Table 3 Results of CA-PLSA model for soil copper content反射率类型RCRMSECRPRMSEPRPDR0.172.940.135.661.07FD0.612.020.334.981.22S