温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
深度
学习
和数
形态学
地区
农村
住房
智能
识别
研究
劳春华
第 43 卷 第 2 期2023 年 2 月Vol.43,No.2Feb.,2023热带地理TROPICAL GEOGRAPHY基于深度学习和数学形态学的经济欠发达地区农村住房智能识别研究劳春华,林燕慧(广东工业大学 管理学院,广州 510520)摘要:中国大部分农村住房处于一种无规划的自发性建设状态。这种无序扩张是对土地资源的严重浪费,尤其是耕地资源,因此需要通过对农村住房监测来规范农房建设,同时保护耕地资源。而中国目前的农村住房监测手段主要以全国土地调查人工巡查为主,该方法收集到的信息缺乏实时性和可靠性。针对该问题,文章提出一个基于深度学习和数学形态学的经济欠发达地区农村住房智能识别模型,该模型基于高分辨率遥感影像数据和PaddlePaddle框架,创新性地引入数学形态学的膨胀腐蚀方法,并与MobileNetV2进行松散耦合,其在农村住房识别监测中的平均精度达到84.5%,且具有一定的泛化性。与ResNet34模型进行对比,该模型平均识别精度比ResNet34模型高10.6%,对地类边界的提取效果更精细,对农村住房轮廓的识别效果更好。关键词:深度学习;MobileNetV2;农村住房;数学形态学;高分辨率遥感影像;智能识别中图分类号:TP391.41;TP183 文献标志码:A 文章编号:1001-5221(2023)02-0179-11DOI:10.13284/ki.rddl.003628 开放科学(资源服务)标识码(OSID):随着中国经济的高速发展以及政府在政策和资金上的支持,农村住房的需求量和建设量开始不断增大。20002020年,广东省农村建设量增长迅速,平均每年增长16.569万户,其中2019和2020年的增长速度较快,高于平均水平的 75.38%和65.25%(广东农村统计年鉴 编辑委员会,2021)。当前,由于中国的农村村庄规划指导性较弱,大部分农村住房仍处于一种无规划的自发性建设状态,建设随意性较大(王晶 等,2016;胡典雄,2018)。农民盲目占用耕地资源新建住房,导致大量耕地面积被占用,耕地总量明显下降,农村住房建设的无序扩张与耕地占用是对耕地资源的严重浪费(赵其国 等,2006)。作为人均耕地面积不足世界平均水平40%的人口第一大国,当前迫切需要进行农村住房监测以减少耕地占用现象,并促进农村住房集约利用,这对中国耕地资源的可持续性发展和粮食安全具有重要意义。中国当前农村住房监测的主要手段是全国土地调查,传统的数据获取方法以人工实地测绘及地方上报等方式为主,这种方式因为工作量大而耗费大量的人力与时间,导致巡查效率较低、难以满足即时性需求(武东海 等,2018)。并且由于专业素养和主观认知的差异,所获取的建筑物数据质量不一,还容易漏检,其信息真伪性和实效性得不到保障。如果在调查过程中遇到疫情、恶劣天气、交通状况、当地实际情况等不可抗拒力因素的影响,巡查的可靠性也难以得到保障。近年来,深度学习技术迅猛发展,在多个领域均取得良好的应用效果,如人脸识别、语音识别、目标识别、自动驾驶、机器翻译、图像识别及分类等(张号逵 等,2018;林倩 等,2019;郑远攀 等,2019;刘娟宏 等,2020;贺丰收 等,2020;朱向雷 等,2021;余璀璨 等,2021),为农村住房识别提供新的思路。农村住房识别的本质是图像分类问题,可以通过学习大量的样本数据对图形进行特征提取,从而智能化地得到农村住房识别结果。卷积收稿日期:2022-09-30;修回日期:2022-11-26基金项目:国家自然科学基金项目(41901312);广东省基础与应用基础研究基金项目(2020A1515010677)作者简介:劳春华(1986),男,广东茂名人,讲师,博士,主要从事土地科学方面的相关研究,(E-mail)。劳春华,林燕慧.2023.基于深度学习和数学形态学的经济欠发达地区农村住房智能识别研究.热带地理,43(2):179-189.Lao Chunhua,and Lin Yanhui.2023.Intelligent Identification of Rural Housing in Economically Underdeveloped Areas Based on Deep Learning and Mathematical Morphology.Tropical Geography,43(2):179-189.43 卷热带地理神经网络(Convolutional Neural Networks,CNN)是一种典型的深度学习图像分类算法,一般由一个或多个卷积层、池化层以及全连接层组成,其提取的效果更胜于传统人工特征与传统浅层分类器,是遥感地类目标检测、图像分类与识别、图像分割等领域的研究热点(张慧 等,2017)。卷积神经网络在图像识别中常用的模型有AlexNet(Abdel-rahman et al.,2011)、VGGNet(Karen et al.,2014)、GoogleNet(Szegedy et al.,2015)、ResNet(He et al.,2016)、MobileNet(Howard et al.,2017)等。其中,AlexNet网络最早用于数字识别,其优点是使用ReLU作为激活函数从而加快收敛速度,使用dropout避免过拟合,使用data augmentation扩增数据集,缺点是参数过多,计算量较大;VGGNet网络的优点是结构非常简洁,通过不断加深网络结构提升其自身性能,缺点是需要 耗 费 较 多 计 算 资 源,并 且 比 较 占 内 存;GoogleNet网络的优点是模型既准又轻,用GAP代替全连接层,在便于迁移学习的同时提高准确率,缺点是网络不够深、迁移能力不足;ResNet是2015年ImageNet竞赛的冠军,优点是可有效解决深度学习神经网络难以训练的问题,缺点是ResNet前后层之间的短接没有很好的复用各层之间的特征图,因此导致模型随着层数的增加,参数量也快速增加;MobileNet是典型的轻量化网络,被广泛应用于工业界。2017年推出的MobileNetV1(Howard et al.,2017)卷积神经网络,以深度可分离卷积替换标准卷积的方式降低网络结构的大小及计算复杂度,并在略微降低精度的情况下大幅度减小模型的运算量,降低对用户硬件环境的要求,从而提升用户体验、提高访问的灵活性。其不足是在训练过程中深度可分离卷积的参数值为0,导致训练结果不理想。而 MobileNetV2(Sandler et al.,2018)网络在 MobileNetV1的基础上进行改进,新增层之间的线性瓶颈、瓶颈之间的连接捷径功能,具有体积小、计算量少、速度高及准确率高等特点。一些学者采用MobileNetV2对遥感影像的建筑物进行提取,如王华俊等(2022)提出使用轻量级网络MobileNetV2替换 DeepLabv3+的主干网络Xception的方法,该方法不仅减少参数量和训练时间,而且有效提高建筑物的提取精度。许博鸣等(2019)通过Keras框架获取MobileNet瓶颈层并进行迁移学习从而实现建筑物识别,该模型具有较高识别率且降低模型权重空间的优点。于坤等(2021)将MobileNet和U-net耦合,解决了建筑物特征提取过程中低维信息丢失,边缘提取效果不佳等问题,在视觉效果上表现优异。综上,MobileNetV2是对目标检测和分割的有效特征提取器,同时是一个高效的移动端模型。构建基于MobileNetV2的农村住房识别模型并开发基于该模型的桌面端和移动端应用,能够极大提升农村住房监测的内业处理与外业巡查效率与智能化水平,具有重要的应用价值,因此本文选用该模型从高分辨率遥感影像自动提取农村住房。美国地理学家W R Tobler在1970年提出地理学第一定律(Tobler,1970),该定律指出“任何事物都相关,只是相近的事物关联更紧密”,即地理事物或属性在空间分布上互为相关(李小文 等,2007)。因此中国的农村住房也具有空间相关性(李郇 等,2022),利用MobileNetV2模型识别农村住房区域时,有可能会出现漏提现象,导致提取结果的形态相对破碎,因此需采用新的方法改善。数学形态学是一门建立在格论和拓扑学基础上、以形态结构元素为基础对图像进行分析的数学工具(陈晨 等,2019),数学形态学检测中最基本的形态算符包括膨胀算符、腐蚀算符。膨胀和腐蚀(邓仕超 等,2017)是灰度图像的初等形态运算,其作用是消除噪声、分割出独立的图像元素或在图像中连接相邻的元素,寻找图像的明显极大值区域或极小值区域、求出图像的梯度等。因此,可将数学形态学上的膨胀腐蚀方法作为补充,根据中国农村住房的空间相关性,将农村住房识别结果进行像素分割或像素连接,弥补部分深度学习识别错误的情况。因此,本文基于高分辨率遥感影像数据,耦合MobileNetV2和数学形态学方法,以茂名市为例,采集茂名市高分辨率遥感卫星影像样本库进行训练,得到一个基于深度学习的经济欠发达地区农村住房智能识别模型(MobileNet-MM)。以期为中国农村住房监测提供技术支持。1 方法 1.1MoblieNet V2网络模型原理为了最大程度降低模型训练成本,使其适用于移动端等轻量工业化业务应用场景,谷歌团队开发了 MobileNet网络模型。2018年,Mark Sandler对MobileNetV1 进行改进并提出 MobileNetV2 模型,MobileNetV2 引入具有线性瓶颈的倒置残差模块(Sandler et al.,2018),借 鉴 了 MobileNetV1 和ResNet的优点,依然保持良好的计算速度和较小的180劳春华等:基于深度学习和数学形态学的经济欠发达地区农村住房智能识别研究2 期存储需求,不仅在MobileNetV1深度可分离卷积的基础上加入多个逐点卷积,并且借鉴ResNet网络结构,提升网络结构性能并降低计算复杂度。但存在两点不足:一是参数调节问题,二是依赖于优化策略。其网络结构如表1所示。MobileNetV2神经网络是深度可分离卷积网络,首先用11卷积过ReLU提升通道数,再用Depthwise的33空间卷积过ReLU进行卷积,最后用11卷积过 ReLU 恢复通道,并和输入相加(图 1)。MobileNetV2具有参数数目较少、效率更优、硬件要求更低的特点,适用于农村住房识别研究。1.2数学形态学的膨胀与腐蚀方法马瑟荣(Ripley et al.,1975)和赛拉(Serra,1986)将数学形态学(mathematics morphology)引入图像处理领域。数学形态学由膨胀、腐蚀、开运算和闭运算构成。膨胀(dilation)是使物体边界扩张的过程,而腐蚀(erosion)的作用则与膨胀相反,其概念是缩小图像,去除小沟壑细节的一种操作。在图像处理过程中,两者经常被混合使用,形成开运算与闭运算。开运算指先腐蚀后膨胀,即先消除细点处的分离物体,继而平滑较大的物体边界。相反,闭运算则是先膨胀后腐蚀,即先将图像的细小空洞进行填空,再抑制比结构元小的暗细节。膨胀和腐蚀的目的是消除噪声,在进行膨胀腐蚀操作前需先定义一个卷积核,将卷积核与待测图像进行卷积计算 从 而 得 到 膨 胀 和 腐 蚀 后 的 结果(图2)。图2表示结构A被卷积核腐蚀,移动结构卷积核,如果卷积核能与结构A完全重叠,则保留该位置点,最终得到结构A的腐蚀结果(结构B);卷积核在结构B上进行卷积操作,移动卷积核,如果卷积核与结构B存在重叠区域,则记录该区域位置,最终得到结构B的膨胀结果(结构C)。结构C与结构 A 相比,去除了部分小地物,填充了部分小空洞。1.3耦合MobileNetV2和数学形态学的农村住房识别模型首先,构建高分辨率遥感影像农村住房样本库;然后,构建农村住房智能识别模型;最后,将该模型应用于经济欠发达地区农村住房自动提取。利用 PaddlePaddle 人工智能基础平台,搭建耦合MobileNetV2神经网络与