温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
深度
学习
生产
建设项目
扰动
自动
提取
康芮
第 卷 第 期 年 月中 国 水 土 保 持 科 学 基于深度学习的生产建设项目扰动图斑自动提取康 芮,邱新玲,马鸿财,宋鹏宇(航天宏图信息技术股份有限公司,北京;湖北商贸学院人工智能学院,武汉)摘要:快速获取生产建设项目扰动范围,对提高水土保持监督检查效率、控制人为水土流失具有重要意义。生产建设项目数量多且分布广,遥感技术能够及时、准确获取其空间分布。当前开展生产建设项目自动提取的研究较少,方法以面向对象分类为主,存在专业性强、区域适用性低、工程化应用难度高等问题。基于高分一号、高分六号遥感影像,分析归纳生产建设项目扰动特征,将裸地和新增建设用地确定为生产建设项目检测的特征地物,分别采用改进的 模型和 模型,开展生产建设项目扰动图斑提取试验研究,并结合扰动图斑面积特点,设置最小识别面积。结果显示:当最小识别面积为 时,模型平均数量准确率为.,数量召回率为.,面积准确率为.,面积召回率为.,整体分类效果较好,能够有效缓解样本数量不均衡的问题,更适用于生产建设项目扰动图斑自动提取。该结果可为全国大范围监管提供有效的方法。关键词:生产建设项目;深度学习;中图分类号:;文献标志码:文章编号:():收稿日期:修回日期:第一作者简介:康芮(),女,硕士。主要研究方向:遥感和地理信息系统。:通信作者简介:邱新玲(),女,硕士。主要研究方向:深度学习算法。:,(,;,):,第 期康芮等:基于深度学习的生产建设项目扰动图斑自动提取,),),),),),.,.,.,.,:;随着、等国产高分辨率遥感卫星的出现,遥感技术在水土保持业务中的应用逐渐普遍。年以来,水利部组织开展生产建设项目遥感监管工作,每年采用高分辨率卫星遥感影像,对全国范围进行至少一次生产建设项目扰动状况遥感调查,提取所有存在开挖、占压、堆弃等扰动或者破坏地表行为的生产建设项目,成果可为水行政主管部门开展生产建设项目监督检查工作提供依据。遥感监管工作在各省市逐步开展,促使生产建设项目扰动图斑的自动提取研究不断出现。徐晓伟等采用基于规则的和以光谱信息辅助的面向对象监督分类方法,分别对天津市静海区不同时相高分影像上的扰动图斑进行提取;毕永清采用面向对象的分类后监测法和分类前监测法,实现对西藏墨竹工卡县扰动区的动态监测;亢庆等采用面向对象的监督分类方法,实现对广东省生产建设项目水土保持监管示范县典型样区内扰动图斑的自动识别;高志强等构建面向对象的多层次提取模型,获取陕西省榆林市横山县生产建设项目地块信息。现有研究以局部地区的探索试验为主,主要采用面向对象的分类方法,虽提取精度较高,但需针对不同地区设置不同分割尺度、选择不同分类特征、确定不同分类规则,并且对人员专业知识水平要求高。因此,目前自动检测方法仍处于研究阶段,遥感监管将人机交互解译作为主要的技术方法。深度学习作为人工智能的关键技术,具有提取特征能力强、识别精度高、效率高等优点,目前已在人脸识别、医学图像识别等图像识别领域被广泛应用,同时也被逐渐引入遥感图像分类中。为提高生产建设项目遥感监管工作效率,笔者探索应用深度学习技术进行生产建设项目扰动图斑自动提取。研究区概况研究区位于甘肃省中部和东部,地理位置为 ,包括兰州、白银、定西、临夏、甘南、陇南、天水、平凉、庆阳等 个市(自治州),共计 个县(市、区)。土地总面积.万,占全省总面积的.。研究区地处青藏高原、内蒙古高原和黄土高原的交汇地带,全区大部分地区海拔 ,山地和高原是主要的地貌类型。由于纬度、气候、土壤和地貌等因素的差异,植被具有明显的纬度地带性和海拔地带性,可分为阔叶混交林地带、落叶阔叶林地带、森林草原地带和草原地带。近年来,甘肃省经济发展速度不断加快,房地产中国水土保持科学 年工程、加工制造类项目、公路工程、露天非金属矿等生产建设活动频繁,破坏地表植被,人为水土流失日益严重,制约区域经济社会可持续发展。数据和方法本研究所使用的数据主要是高分辨率遥感影像和生产建设项目区域监管扰动图斑矢量数据。遥感影像采用高分一号()影像、高分六号()影像,获取时间为 年 月,空间分辨率为,含有 个波段。生产建设项目区域监管扰动图斑矢量数据来源于甘肃省 年生产建设项目遥感监管项目,采用内业目视解译和现场复核相结合的方法获得。扰动图斑包括历史图斑和 年新增图斑,历史图斑已根据 年影像进行边界更新和属性更新。选取扰动变化类型为“新增”“扰动范围扩大”“扰动范围缩小”“扰动范围不变”的扰动图斑用于样本库构建和精度评价。.生产建设项目扰动特征分析生产建设项目在工程施工前期,破坏原有地形地貌,进行场地平整和开挖堆积,会形成大面积的裸露地表,在遥感影像上表现为裸地;施工后期,修建房屋、硬化地表,在遥感影像上表现新增建设用地。因此,根据扰动图斑地表覆盖特征,将裸地、新增建设用地作为生产建设项目扰动图斑自动化提取的目标地物。裸地在遥感影像上具有以下特征:反射率较高,面积较大,边界清晰,纹理均一,内部有小面积建筑物或防尘网,周边有道路(图)。新增建设用地在遥感影像上具体以下特征:形状规则,边界清晰;建筑物、硬化地表周边或内部有连续、成片裸地;内部无植被覆盖;部分新增建设用地纹理杂乱无序,内部有脚架等施工设施(图)。图 裸地遥感解译标志 图 新增建设用地遥感解译标志 .样本库构建样本库构建是深度学习模型训练的基础。基于 年 月高分遥感影像,通过手动标注的方式,建立生产建设项目扰动图斑样本库,包括 个样本,其中裸地样本 个,新增建设用地样本 个。)样本区域确定。由于生产建设项目扰动图斑影像特征复杂多变,并且容易受到周边地形地貌、植被等自然条件的影响,为确保选取的样本具有代表性,在兰州市皋兰县、兰州市榆中县、天水市麦积区、天水市秦州区、平凉市庄浪县、平凉市庄浪县、平凉市华亭市、平凉市崆峒区、庆阳市西峰区、庆阳市庆城县、陇南市武都区、陇南市文县等 个区(县)内选取生产建设项目扰动图斑样本。)样本标注。根据生产建设项目扰动图斑自动提取的需求,基于 年生产建设项目区域监管成果,进行样本标注。根据地表覆盖特征,将扰动图斑分为裸地、新增建设用地 类。第 期康芮等:基于深度学习的生产建设项目扰动图斑自动提取)样本标签制作。通过数据格式转换,将每一个样本区域遥感影像对应的矢量数据转换成栅格数据,即样本标签数据,数据分辨率、像元数与对应的遥感影像保持一致。由于 内存有限,模型输入数据大小受限,将样本标签数据、遥感影像裁剪为 像素 像素的切片数据。为增加样本数量,提高模型精度,裁剪步长取,即相邻切片具有的重合率,共获得 张切片数据。将处理好的切片数据进行随机划分,其中训练集和验证集的比例为 。)样本增强。采用水平翻转、竖直翻转、随机旋转、随机裁剪、变形缩放、颜色变换、噪声、模糊等数据增强方式来增加样本的数据量和多样性,提高模型的泛化能力及其模型的鲁棒性。.模型训练和验证利用 深度学习框架,分别采用 模型和 模型对生产建设项目扰动图斑进行自动提取试验。:图 网络结构 )模型。模型将()模块应用到 网络执行语义分割任务中。在编码阶段,首先应用 作为骨干网络提取原图像特征,然后引入()模块提取高层次特征,与原始 模块不同,改进后的模块利用深度可分离的空洞卷积进行计算,大大减少了参数数量和运算成本,同时保持精度。如图 所示,深度可分离卷积首先对每个通道特征图分别进行 的卷积计算,然后再进行 的点卷积运算将不同通道信息融合。将 模块与深度可分离卷积进行融合,需要将深度可分离卷积中的 大小的一般卷积改为带孔卷积,再进行深度可分离卷积计算。模块参考遥感影像不同尺度的特征图,并且空洞卷积的使用加强了提取稠密特征的能力,因此该结构具有可以提取遥感影像高层特征的优点,但是 模块存在池化和有步长的卷积,导致遥感影像的边界信息严重丢失。因此,在解码器阶段,借鉴()的跳步连接方式,连接低层特征和高层特征,修复遥感影像尖锐边界的问题。其中,通过低层次特征的引入增强影像特征非线性表达能力,有效缓解 模型在小尺度目标提取方面所出现的孔洞问题。利用 通道 卷积对低层次特征图卷积,再融入 采样的高层次特征图,从而实现模型更好地优化。将融合后的特征输入到深度可分离卷积结构模块中,此结构是多个深度可分离卷积串行组成,本研究默认为 个。最后接入分类卷积进行分类预测和损失计算。中国水土保持科学 年由于样本数量差异较大,裸地样本数远远大于新增建设用地类别数量,导致样本不均衡问题较严重,因此将损失函数取为在线困难样例挖掘(,)交叉熵损失函数。该函数对损失较大的样本赋予权重,从而通过反向传递改善该类样本的预测精度。另外通过在低层次模块进行上采样和卷积操作计算交叉熵损失。种损失函数的权重比例设为.。本次在训练网络学习参数的过程中,使用基于 数据集的预训练模型,利用随机梯度下降算法(,)为优化算法,初始学习率为.,动量参数为.,权重衰减率为.,学习率的下降函数采用多项式计算,指数参数为.,最小学习率达到.。利用 张 显卡,显存进行分布式训练,同时加入混合精度加速模型训练。)模型。模型是一种改进的 结构,模型由压缩通道和扩展通道组成(图)。压缩通道用于特征提取,属于典型的卷积神经网络结构,重复采用 个卷积层和 个最大池化层的结构,卷积核大小为,池化层步长为,激活函数为线性整流函数。扩展通道利用反卷积层还原影像尺寸。图 网络结构 采用 作为骨干网,是具有高精度的轻量型网络,替代原始的 编码结构可大大减小计算量,同时保持精度。另外在解码模块加入注意力机制,采用同时考虑空间和通道维度的注意 力 机 制 ()用于提高模型精度。训练方法同上,不再赘述。)模型验证。采用基于像素的精度评价方法,针对裸地、新增建设用地 种类型,选取像素精度、交互比(,)、准确率、召回率等评价指标,分别对 模型、模型预测结果进行精度验证。验证集不同模型精度评价如表 所示。结果显示,模型、模型对裸地的预测效果较好,像素精度、准确率达到 以上,交互比和召回率分别达到 以上;模型对样本数量较少的新增建设用地预测效果较好,各项指标均达到 以上;模型各项指标均优于 模型,整体分类效果较好,并且能够有效缓解样本数量不均衡的问题。表 个模型验证精度评价结果 类别 像素精度交互比 准确率召回率 像素精度交互比 准确率召回率 裸地 .新增建设用地 .第 期康芮等:基于深度学习的生产建设项目扰动图斑自动提取.分类后处理模型预测结束后,根据目标大小及影像分辨率,设置最小识别面积,对面积小于一定阈值的图斑进行过滤,减少小图斑对提取结果的干扰。统计分析甘肃省 年生产建设项目遥感监管结果发现,面积 的扰动图斑比例;因此,设置.、.和.类最小识别面积进行提取结果对比。.精度评价将甘肃省 年生产建设项目遥感监管项目成果作为验证数据,以提取结果与地表真值重叠率达到 以上的图斑为正确图斑,采用数量召回率、数量准确率、面积召回率、面积准确率等指标定量评价生产建设项目扰动图斑自动提取结果。计算式如下:数量召回率 正确图斑数量实际图斑数量;()数量准确率 正确图斑数量提取图斑数量;()面积召回率 正确图斑面积实际图斑面积;()面积准确率 正确图斑面积提取图斑面积。()结果与分析为验证模型适用性,选取兰州市城关区、庆阳市正宁县和白银市白银区 个区(县),分别采用 模型、模型,设置.、.和 类最小识别面积开展生产建设项目扰动图斑自动提取试验,并与 年生产建设项目遥感监管项目成果进行对比分析。.兰州市城关区城关区位于甘肃省中东部,是兰州市的经济、交通中心,区域总面积 。以 年生产建设项目遥感监管项目成果为基础,经过人工筛选确定全区共有 个扰动图斑,扰动面积 .。项目类型以房地产工程为主。模型预测耗时 。城关区生产建设项目扰动图斑自动提取效果如图 所示。从定性的角度分析,种模型均可正确提取裸地类型的扰动图斑,并且 模型提取结果更为完整;对于新增建设用地类型的扰动图斑,模型提取效果更好,漏提少,并且边界规则,而 模型提取结果破碎,且漏提较多;模型、模型均将部分荒地错提为扰动图斑。城关区生产建设项目扰动图斑自动提取精度如表 所示。从定量的角度分析,模型的准确率