温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
最大
模型
遥感
土地利用
分类
研究
东阳
第 卷,第 期自 然 资 源 遥 感,年 月 ,:引用格式:熊东阳,张林,李国庆 基于最大熵模型的遥感土地利用多分类研究 自然资源遥感,():(,():)基于最大熵模型的遥感土地利用多分类研究熊东阳,张 林,李国庆,(中国科学院教育部水土保持与生态环境研究中心,杨凌;中国科学院水利部水土保持研究所,杨凌;中国科学院大学,北京;西北农林科技大学黄土高原土壤侵蚀与旱地农业国家重点实验室,杨凌)摘要:影像解译中对土地利用单分类的关注成为遥感研究的热点问题。最大熵模型()被评价为最有潜力的单分类算法,被广泛应用于土地利用的单分类研究。然而,单分类算法(包括)是否能够进行土地利用多分类尚不明晰。为了解决该问题,文章建立了利用 进行遥感土地利用多分类的技术流程,并将该流程应用在云岩河流域的土地利用多分类研究中。使用总体分类精度、系数、灵敏度以及特异度评估 的总体分类效果以及在各个地类上的预测表现;同时使用 值评估 与随机森林(,)、最大似然法(,)、支持向量机(,)在土地利用预测上的一致性表现。结果表明:的分类表现最好,总体分类精度为,系数为 ;在各个地类上没有最差的表现,甚至在某些地类上达到了最优的表现;与 和 的分类一致性较高,这 种算法预测的土地利用之间一致性评估 值均超过了 ;与其他 种分类算法预测土地利用的差异较大,值小于,说明 不适合该地区的土地利用解译。文章建立的技术流程仅仅依赖于土地利用发生概率,而不依赖于阈值选择,从而使得以 为代表的单分类算法在遥感土地多分类应用中能够发挥巨大潜力。对于大范围的土地利用解译,加入并行计算将有利于提高利用 解决多分类问题的时间效率。关键词:最大熵模型;土地利用;单分类算法;多分类算法;遥感解译;云岩河流域中图法分类号:文献标志码:文章编号:()收稿日期:;修订日期:基金项目:国家自然科学基金项目“潜在植被约束条件下气候变化诱导树种聚合模式演变及其对森林经营启示 以黄土高原为例”(编号:)和国家重点研发计划项目“黄土高原人工生态系统结构改善和功能提升技术”(编号:)共同资助。第一作者:熊东阳(),男,硕士研究生,主要从事遥感土地利用分类算法的研究。:。通信作者:李国庆(),男,副研究员,主要从事植被恢复与 模拟的研究。:。引言土地是地表某一地段包括地质、地貌、气候、水文、土壤、植被等多种自然要素在内的自然综合体,是人类赖以生存与发展的重要资源和物质基础,为人类提供了居住、生产等各方面的资源和条件。因此,获取准确的土地利用信息对于资源调查、环境监控以及国土空间规划与优化布局等诸多生产实践活动起着十分重要的支持作用。传统的土地利用调查是一项工作强度大、时间周期长的系统工程。遥感技术的出现和发展为人类提供了从多维和宏观的角度去认识和研究土地利用的新手段和新方法,同时大大节省了获取土地利用信息的时间和成本。利用卫星影像数据进行土地利用分类是遥感应用研究的主要方向之一。近些年来,随着机器学习技术的高速发展,遥感影像分类算法得到了极大丰富。影像分类算法主要向传统的多分类算法和新颖的单分类算法 个方向发展。在传统的土地利用分类研究中,其主要目标是如何将观察到的众多地物分开,因此发展了很多非常成熟的分类算法,包括支持向量机(,)、随机森林法(,)、最大似然法(,)以及人工神经网络(,)等。随着遥感影像应用广度和深度的拓展,研究的兴趣越来越聚焦于某一种地类,而不关注其他地类,这样做的好处是不需要获得与研究目标无关地物的训练样本点,从而使得遥感解译的野外调查工作量减少。因此产生了很多单分类算法,例如单第 期熊东阳,等:基于最大熵模型的遥感土地利用多分类研究分类支持向量机(,)、最 大 熵 模 型(,)等。将多分类算法应用在单分类实践中,已经有较多的探索。然而将单分类算法应用在多分类的实践中,却很少有研究关注这个问题。这个问题的解决对于拓展遥感多分类算法库有重要的实践意义,同时也对单分类和多分类算法的交叉和融合有重要的理论意义。是一个近年来在影像单分类领域应用最广泛的算法之一,也被评价为最有潜力的算法。在利用 识别单个土地类型时,只需要对感兴趣土地利用类型的样本点进行训练,而不需要训练其他土地利用类型的样本。等利用 和 对一幅 空间分辨率的航空相片进行单个土地类别的分类,结果表明 比 的表现更优;等基于最大熵模型,利用 地表反射率数据、归一化植被指数数据以及夜间灯光遥感数据等进行中国城市用地提取时也获得了较好的效果。然而,这些研究仅仅是利用 进行单个土地利用类型分类,而不是多类土地利用分类,从而无法与传统遥感影像多分类算法进行比较。为了探讨将单分类算法应用来解决多分类问题,并进一步丰富遥感土地利用多分类的算法库,本文建立了利用 进行土地利用多分类的技术流程,并将此模型应用于云岩河流域的土地利用解译中。通过比较 与传统多分类算法(,和)对遥感影像解译的差异,探究 在遥感土地利用分类应用中的优劣。本研究为遥感土地利用多分类研究提供了一个新的视角,以期更有利于 在遥感领域的应用与发展。研究区概况和数据源 研究区概况云岩河流域位于陕西省延安市中东部(,如图 所示),是黄河中游的一级支流,干流全长 ,流域总面积为 ,云岩河流域地势西高东低,海拔大致在 之间。气候属于半干旱大陆性季风型气候,一年四季冷暖干湿差异显著。该流域降水季节差异大,年降水量约为 ,并主要集中于 月份。流域地表覆盖主要为厚层黄土,属于典型的以黄土塬为主的塬梁沟壑区。该地区水资源比较丰富,建设有小型灌溉设施以及水电工程。图 研究区概况 数据来源及预处理本文所用的遥感数据为 卫星影像,条带号分别为 和,数据来源于地理空间数据云(:),选取春季(月、月、月)、夏季(月、月、月)、秋季(月、月、月)以及冬季(月、月、月)各 景影像;卫星包括 个传感器、个波段,本研究采用陆地成像仪中的 波段参与分类,其参数信息如表 所示。卫星影像可能会受到周围环境、传感器系统误差等因素的影响,从而产生一定的辐射差异,因此在使用之前需进行预处理。遥感影像的预处理过程主要包括辐射定标、大气校正、影像镶嵌以及裁剪等。表 陆地成像仪波段 参数特征 传感器类型波段波长范围 空间分辨率 主要应用领域陆 地成 像仪(蓝光波段)用于水体穿透、分辨植被和土壤等(绿光波段)用于分辨植被等(红光波段)用于观测道路、裸露土壤和植被等(近 红 外 波段)用于估算生物量、分辨潮湿土壤等 (短波红外 波段)用于分辨道路、土壤和水等 (短波红外 波段)用于矿物识别、分辨植被和潮湿土壤等 数字高程模型(,)数据是进行流域水文分析的基础空间数据,本研究所用的 空间分辨率的 数据来源于地理空间数据云。首先对初始的 幅 数据进行图像镶嵌,使镶嵌后的 包含完自 然 资 源 遥 感 年整的研究区范围;为了减少计算量、提高运算速度,对镶嵌后的 数据进行不规则裁剪处理;然后利用 模型对经过裁剪处理后的 数据进行洼地填充、确定水流方向和计算累积流量等处理,提取云岩河流域矢量边界。是基于()模型开发的,与 配套使用。依据我国土地利用分类现状(),并结合云岩河流域的实际情况,本研究将该流域土地利用类型划分为 类:森林、灌木、草地、耕地、建设用地(房屋和道路)。在对该地区进行广泛实地踏勘的基础上,利用 平台上的高分辨率影像进行随机采样,使采样点尽可能在研究区范围内均匀分布。本研究一共获得 个坐标点,其中包括森林 个、灌木 个、草地 个、耕地 个、建设用地 个。研究方法 的基本思想 是由最大熵原理推导实现的,最大熵原理是在 年 基于 的信息熵概念提出的,其基本思想是仅用已知有限信息推断未知的概率分布,未知信息被假设呈“均匀分布”的,通过熵的最大化来表示这种均匀分布。假设未知概率分布()在一个有限集合 上,其中,(其中 为训练点个数)表示在集合 上的训练样本,对未知概率分布()的约束条件是由集合 上的一组特征,(其中 为特征数)表示,这些特征是对有限集合 的不完整描述。为了估计集合 上的未知概率分布(),需要构造一个近似于未知概率分布()的经验分布?(),其经验分布?()可以表述为:?():。()其中,特征函数 关于经验分布?()的期望值,用?()表示,即?()()。()如果模型可以获取训练数据中的信息,那么可以假设未知概率分布的期望值与其经验分布的期望值相同,可以表述为:()?()。()未知概率分布()的熵可以定义为:()()()。()模型认为,应该在所有满足已知约束条件的模型集合中选取熵最大的模型。软件利用“最大熵原理”估计物种的分布概率,其分布(吉布斯分布)形式为:()(),()式中:为环境变量的个数;为不同环境变量的权重;()为第 个环境变量;为归一化常数。构建基于 的土地利用多分类技术流程 是一种概率模型,主要可用于解决单分类问题,。当 应用于遥感影像分类时,研究区的每一个栅格构成了定义 概率分布的空间,每一个地类的训练数据构成样本点(即每个地类的“存在”数据),分类特征数据主要包括遥感影像的不同波段和时段的数据。本文利用 解决遥感影像的多分类问题,基于 等用 语言编写的可以免费获取的 软 件(:)。基本思想是先进行单分类研究,再整合单分类的结果,最终形成土地利用图。其主要技术流程如图 所示。图 最大熵模型进行土地利用多分类的技术流程 )假设研究区共有 种土地利用类型,在 软件中输入 种土地利用类型地面采样点的坐标数据和经过预处理后的遥感影像不同波段数据。)运行结束后,输出 个概率分布图层,第 个第 期熊东阳,等:基于最大熵模型的遥感土地利用多分类研究概率分布图层的栅格值代表该栅格属于第 种土地利用类型的发生概率图。)分别对 个概率分布图层(土地利用类型)编号为,对 软件输出的 个概率分布图层进行空间叠加分析,通过对比 个图层同一位置的概率数值,输出该位置栅格值最大的图层所对应的图层编号。)获得的编号图层即为利用 分类得到的土地利用图。与传统多分类算法比较遥感土地利用分类的目的是将影像中的每一个像元根据其在不同波段的光谱特征、空间结构特征以及其他辅助信息,利用不同的分类算法或数学规则划分到不同的土地利用类别中去,。本研究使用 和 种传统算法进行土地利用分类,即,和,。利 用 软件和 软件(:)实现,和 通过 包中的 函数实现,通过 软件中内置的 模块实现。遥感多分类算法的比较主要包括 种算法的预测准确性评估和算法之间一致性评估。种算法预测准确性评估利用 将通过 高分辨率影像获得的地面采样点数据按照 的比例进行随机分割,其中 的采样点数据用做训练集,用于训练分类器;的采样点数据用做测试集,用于精度评估。利用总体分类精度(,)、系数、灵敏度指数以及特异度指数作为土地利用分类精度评价指标。)总体分类效果评估。和 系数是用来反映分类器的整体表现。描述了遥感影像的分类结果与地面实际的土地利用类型相一致的概率;分析是一种用于准确性评估的离散的多元技术,它考虑了混淆矩阵的所有因素,克服了其他精度评价指标的缺陷,因此常作为比较各分类器总体分类表现优劣的指标。和 系数的计算公式分别为:,()()(),()式中:为土地利用类型数;为总的用于精度评估的采样点数量;为混淆矩阵上第 行、第 列上的像元数量(即正确分类的像元数量);和 为第 行和第 列上总的像元数量。)分土地要素的评估。灵敏度和特异度是用来反映分类器在不同土地利用类别上的分类表现。灵敏度和特异度的计算公式分别为:,(),()式中:为灵敏度;为特异度;为实际为某一地类且预测为该地类的像元数量(真阳性);为实际为某一地类但预测不为该地类的像元数量(假阴性);为实际不为某一地类但预测为该地类的像元数量(假阳性);为实际不为某一地类且预测不为该地类的像元数量(真阴性)。种算法之间一致性评估为了衡量分类图之间的相似性,本文利用 值和混合矩阵进行 种分类算法获得的土地利用图之间的一致性评估。值的计算与总体分类效果评估中的 系数的计算方法相似,但存在区别。具体计算步骤如下:将 种分类算法得到的 个土地利用的栅格图层分别转换为 个向量;将这 个向量之间两两配对计算混合矩阵;通过式()计算