温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
改进
CycleMLP
高分
遥感
图像
采石场
识别
赵宇滨
测 绘 通 报 年 第 期引文格式:赵宇滨,倪欢,牛晓楠 基于改进 的高分遥感图像采石场识别 测绘通报,():基于改进 的高分遥感图像采石场识别赵宇滨,倪 欢,牛晓楠(南京信息工程大学遥感与测绘工程学院,江苏 南京;中国地质调查局南京地质调查中心,江苏 南京)摘要:石矿区生态修复是改善区域生态系统功能的重要环节,识别采石场、确定采矿区边界是完成修复任务的前提。目前,基于深度学习的语义分割技术,能够精准识别高分遥感图像中的感兴趣地物,为采石场识别提供了有效途径。本文基于 框架,利用金字塔结构,将多级特征输入到一个轻量级 解码器中,聚合来自不同层次的特征信息,同时获取局部和全局特征。在前馈网络中嵌入卷积层,避免位置编码插值导致的精度下降现象。引入福建省南安市石矿区语义分割数据集,以训练网络和验证算法精度。结果表明,改进后的 能够从高分遥感图像中有效识别石矿区,与其他基于自注意力机制的方法相比,精度更高,且可以准确界定石矿区边界,能够为修复石矿区生态系统提供可靠支撑材料。关键词:采石场;高分遥感图像;解码器;生态修复中图分类号:文献标识码:文章编号:(),(,;,):,:;目前,采石场对我国部分地区的生态环境产生了恶劣影响,主要包括水土流失、地面沉降、生物多样性减少及地下水污染,矿区生态修复问题严峻。同时,我国采石场数量大、规模小、分布不均,增加了常规野外调查和人工圈定采石场的难度和成本。随着遥感图像分辨率的不断提高,遥感技术为解决上述问题提供了途径,但同时也出现了诸多影响识别准确度的难题。如对于采石场的不同功能区(包括露天采场、中转场、废渣堆、尾矿库等),纹理、光谱、几何形态在高分遥感图像上差异明显,且易与其他地类混淆。因此,目前基于高分遥感图像的采石场识别研究主要依赖野外实地调查,或只能进行小范围的动态监测。而范围较大区域(地级市范围)的采石场识别则受技收稿日期:基金项目:国家自然科学基金();江苏省自然科学基金();南京信息工程大学人才启动项目()作者简介:赵宇滨(),男,硕士生,研究方向为深度学习在遥感图像处理中的应用。:通信作者:倪 欢。:年 第 期 赵宇滨,等:基于改进 的高分遥感图像采石场识别术条件制约。近年来,深度学习驱动的语义分割技术为高分辨率条件下的复杂场景建模提供了技术保障。已有研究开始尝试利用深度学习技术识别采石场,取得了一定成效。全卷 积 神 经 网 络(,)奠定了基于卷积神经网络(,)的语义分割框架。后续研究如、等,进一步提升 了 语 义 分 割 精 度。近 年 来,()借助多头注意力机制,有效建模全局依赖关系,通过一系列改进模型,如()和,不断挑战卷积神经网络。然而,自注意力机制占用大量内存,对高性能设备依赖度过高。因此有学者认为,注意力机制并不是 必 需 的,仅 在 多 层 感 知 机(,)和跳跃链接的基础上建立模型,如 和,可在更低的训练成本条件下,取得较高精度,如 数据集的测试结果。文献借助该思想,提出了一种用于密集预测的循环全连接机制(,),该机制无需复杂计算,可有效顾及全局依赖关系,借助,可构建语义分割网络。本文首先将轻量级 解码器引入 框架,保持较小计算复杂度优势,并进一步提升模型分割精度。通过聚合 金字塔结构底层的局部信息和高层的全局信息,使得轻量级 解码器具备更强大的特征表达能力。然后使用卷积层代替传统的位置编码(,),可避免插值所导致的精度下降问题。最后以福建省南安市石矿区语义分割数据集为例,以证明改进后的 对采石场的识别精度更高,提取的石矿区边界与真值更加吻合。研究方法本文完整的网络结构如图 所示。首先,输入数据为包含 个真彩色波段的无人机高分遥感图像,经过重叠补丁嵌入()模块处理后,被分割为尺寸为 的图像块,通过一个线性层,得到维度为 的特征;然后,分割后的特征输入 特征提取模块,得到阶段 的输出特征,特征维度不变,为了形成金字塔结构,在不同阶段过渡时,进行下采样操作,使得标记()数减少,通道数增多,并依次经过阶段、的处理;最后,将 个阶段的分级特征输入轻量级 解码器,得到最终的预测结果。图 网络结构.分层 编码器.重叠补丁嵌入模块 以一维的补丁嵌入序列作为输入,为保持局部信息的连续性,在分割图像时,相邻的图像补丁()之间留有重叠部分,使分割后的补丁间存在跨窗口联系。其实质是一个卷积核为、步长为 的二维卷积。分割后的补丁统一投影至高维空间。测 绘 通 报 年 第 期.特征提取模块 特征提取模块结构如图 所示。以一维标记嵌入()序列作为输入,进行自注意力机制建模。过程中序列的排列保持固定,无法感知输入序列中图像块的顺序,缺乏卷积网络中的归纳偏置,而这在地物分类中起到关键作用。传统方法牺牲 的灵活性,在序列中的每个标记上添加位置编码,以实现顺序感知。因此模型训练完成后,编码长度固定不变,在测试过程中难以处理序列更长的数据。受一些学者启发,本文在前馈网络中的第 个全连接层()和 之间增加了卷积核为、填充为 的二维卷积代替位置编码。卷积前馈网络以 的输出为输入,具体公式为()()(())()式中,和 分别为 层和卷积前馈神经网络的输出;为 层;为全连接层()。图 特征提取模块.分层结构若干个 特征提取模块堆叠构成一个阶段,每个阶段中的标记()数不变,阶段转换时,处理后的通道数扩大,标记数量减少。该策略能有效降低图像的分辨率。具体而言,网络共有 个阶段,分层结构有效地缓解了分辨率过高导致的复杂场景问题,同时生成多级金字塔特征用于语义分割。.轻量级 解码器本文避免使用其他方法中计算要求高、结构复杂的模块,仅由简单的 层构建轻量级解码器。得益于 的大感受野和 产生的层级特征,编码器能有效结合全局和局部特征,产生强大的特征表达。轻量级 解码器以 编码器提取的多级特征为输入,具体包括以下 个步骤。()统一通道数。将编码器得到的多级特征(,)经过 统一通道数。具体变换公式为,(),()式中,为线性层;、为输入通道数和输出通道数。()上采样。个阶段产生的分级特征具有不同的分辨率,将分级特征统一上采样到原图像块分辨率的,便于特征融合。具体公式为(),()式中,为利用双线性内插法的上采样过程;为对应上采样过程输出的分辨率。()特征融合。将统一通道数和上采样后的多级语义特征连接在一起,并使用 进行特征融合,即 ,(),()式中,为特征连接过程,连接后的通道数为;,为特征融合过程,同时降低语义特征的维度,输入通道数为,输出为。()预测分割掩码。通过另一个 层融合语义特征进行分割预测,输出分辨率为,即 ,()()式中,为最终预测结果;,为线性层;为类别的数量。试验验证本文方法使用 语言和 框架实现。所使用的图形计算设备()为 ,显存为 。参数为()(),.。年 第 期 赵宇滨,等:基于改进 的高分遥感图像采石场识别.试验数据引入福建省南安市无人机高分遥感影像,分辨率为.,其中包括 幅训练图像,分辨率为 像素。该数据集如图 所示(以第 幅训练图像为例)。训练完成后,将模型应用到整个南安市范围,对全市采石场区域进行提取,并与人工实地调绘得到的真值数据进行比较,以验证模型预测精度。图 福建省南安市无人机遥感图像数据和训练图像.训练策略利用随机梯度下降法对模型进行训练,采用如下学习率调整策略|()式中,为当前学习率,随着迭代过程不断衰减;为初始学习率;为当前迭代次数,共进行 次迭代;衰减速率由 控制,本文初始学习率为,为.,为 。同时,为了提高训练效率,使采样更具随机性,训练时不会将整幅图像作为输入,而是从 幅训练图像中随机抽取 个图像块,每个图像块的分辨率为 像素。.精度评价指标使用 值和 指数衡量采石场像素级识别精度。这 种精度衡量指标在国际上被广泛使用,具体原理和细节可参考文献。.试验结果图 为本文方法获得的南安市石矿区识别结果。为了直观地反映采石场识别结果,选取数个典型采石场区域,将本文方法的预测边界、真值边界及高分遥感影像叠加,进行可视化分析。结果如图 所示。所选取的采石场区域包含不同的功能区,露天采石场对应图()();中转场对应图()();建筑区对应图()();废渣堆对应图()()。因此,本文方法能够克服采石场的类内差异,有效提取不同的功能区,且提取的边界与真值边界吻合度高。虽然也存在微小误差,但该问题在计算机自动识别结果中普遍存在。表 为本文方法与现有 类模型的定量对比分析。目前,类模型的计算复杂度较卷积神经网络方法低,如()通常在 以下。但 类模型的内存消耗量显著增加。因此,虽然 较低,但训练速度仍无法显著提高,且更加依赖计算设备性能。因此,本文着重对比模型的内存消耗。在计算相关指标时,设置为,输入为 像素的图像块。图 本文方法识别的南安市石矿区结果表 采石场识别精度对比分析方法耗费内存 参数 ()().本文方法.测 绘 通 报 年 第 期图 本文方法的采石场识别结果(真值边界为蓝色;本文方法识别的边界为红色)现 有 的 种 方 法 包 括、。由表 可知,与其他 网络相比,本文方 法 的 采 石 场 识 别 精 度 最 高。其 中 的 比本文方法低.,值低.。的 比 本 文 方 法 低.,值低.。而与本文方法精度相似的,其网络中使用了大量的卷积层,实质上是卷积网络与 的结合,在较低的参数量和计算复杂度情况下取得了相似的精度,然而 所消耗的内存远高于本文方法,限制了其应用。此外,试验对本文轻量级解码器的重要性进行了分析,即观察去除解码器的情况下采石场识别精度的变化情况。通过比较发现,去除解码器后(即仅使用 进行识别),指数下降了.,值下降了.。由此说明,本文提出的轻量级 解码器对采石场识别起到了关键作用,能有效聚合局部和全局特征信息,减轻因类内差异导致的精度下降问题。如图 所示,选取了 个典型的采石场区域,将不同方法的识别结果进行对比。其中图()为真值,图()()分别为 、及本文方法的采石场识别结果(利用边界表示)。由图()和()可知,去除解码器后,采石场识别精度明显降低,采石场区域漏检现象严重。而引入解码器后识别精度显著提升,识别区域几何形态与真值吻合度高,由此 说 明 轻 量 级 解 码 器 能 够 有 效 聚 合 生 成 的 多 尺 度 特 征,提 高 识 别 精 度。的预测区域比真值范围大,不能精确区分背 景 和 采 石 场。和 同样无法完整识别采石场区域,预测区域的几何形态与真值相差更大。可见,引入本文提出的解码器后,采石场的识别精度显著提升。结 语本文提出了一种面向无人机高分遥感图像采石场识别的方法。该方法以 为网络框架,引入轻量级解码器,克服了不同功能区纹理、光谱、几何形态差异对采石场识别带来的困难。此外,在前馈神经网络中以卷积层代替传统的固定位置编码,避免了预测阶段插值所导致的精度下降问题。以福建省南安市部分区域的采石场高分无人机遥感数据集为例,对该方法进行训练。结合福建省南安市整体区域的高分无人机遥感影像和相应实地调绘数据,进行精度验证。通过与 种 方法进行对比,证明不使用注意力机制的 构架对采石场识别同样有效,且取得了更高的识别精度。与原 网络对比,该方法的识别精度和可视化识别结果明显更优。在未来的研究中,将进一步增强其泛化能力,拟引入无监督域自适应思想,将该方法迁移到多样化地理环境,进一步推动采石场识别的自动化与实用化。年 第 期 赵宇滨,等:基于改进 的高分遥感图像采石场识别图 不同方法采石场识别结果对比参考文献:石丽丽 京西石灰石采石场废弃地植被恢复效果及其评价研究 北京:北京林业大学,宋百敏 北京西山废弃采石场生态恢复研究:自然恢复的过程、特征与机制 济南:山东大学,张玉虎,于长青,宋百敏,等 快速监测评估废弃采石场生态恢复的研究 生态与农村环境学报,():赵浩腾 基于 长时间遥感影像的采石场面积监测与分析 北京:中国科学院大学(中国科学院遥感与数字地球研究所),尹红,杨广斌,安裕伦 贵阳市采石场遥感动态监测研究 环保科技,():马得利,孙永康,杨建英,等 基于无人机遥感技术的废弃采石场立地条件类型划分 北京林业大学学报,():王耿明,朱俊凤,陈捷,等 采石场绿