温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
字典
加权
联合
稀疏
表示
光谱
图像
分类
陈善学
0110002-1研究论文第 43 卷 第 1 期/2023 年 1 月/光学学报基于空谱字典的加权联合稀疏表示高光谱图像分类陈善学1,2,何宇峰1,2*1重庆邮电大学移动通信技术重庆市重点实验室,重庆 400065;2重庆邮电大学通信与信息工程学院,重庆 400065摘要 稀疏表示广泛用于高光谱图像分类任务中。针对字典原子空间信息和光谱信息未得到充分利用的问题,提出了基于空谱字典的加权联合稀疏表示高光谱图像分类算法。计算测试像元与字典原子的空谱联合距离,选择相似度最高的 K 个字典原子,并将被选择字典原子的超像素邻域扩充到新的字典中,形成空谱字典。在联合稀疏模型中,对测试像元的超像素邻域像元使用不同的权重,在空谱字典上构建加权稀疏表示模型。基于所选的两个高光谱数据集的实验证明所提算法能够有效地提高分类精度。关键词 图像处理;高光谱图像分类;空谱字典;超像素;稀疏表示中图分类号 TP751.1 文献标志码 A DOI:10.3788/AOS2208541引 言高光谱图像是星载或机载高光谱成像仪采集数十至数百个连续窄波段光谱数据而成的遥感图像。高光谱图像数据是三维立方体数据,包含每个波段的二维空间信息和每个像元的光谱信息。由于高光谱图像具有丰富的空间信息和光谱信息,故被广泛应用在环境检测、矿物勘探、作物监测和目标识别等领域中1。高光谱图像分类的目的是对图像中的每一个像元赋予地物标签。如今,多种分类技术被应用于高光谱分类中,如支持向量机(SVM)2、多项式逻辑回归3和神经网络4等。近年来,稀疏表示被证明是解决人脸识别、图像超分辨等问题的强有力工具5。稀疏表示的基本假设是:若一个类有足够多的训练样本,则属于此类的测试样本就能利用来自此类的训练样本的线性组合表示6。稀疏表示分类通过对测试样本进行稀疏表示得到稀疏表示参数,计算每一类训练样本的重构残差从而确定测试样本的类别。Chen等6将稀疏表示模型引入到高光谱分类中,根据邻域内像元共享稀疏模型,提出了联合稀疏表示模型。文献 6-9 通过对邻域内像元进行加权的方式削弱不相似元素的影响。陈善学等10使用超像素提高了相邻像素的一致性。李非燕等11通过提取多特征并添加约束的方式构建了稀疏模型。良好的字典可以为测试样本提供合适的子空间,从而达到更好的分类效果。Fang等12采用判别 K-SVD 算法同时学习字典和分类器。Long 等13提出了非局部字典学习稀疏表示方法,使用估计函数选择加入字典的邻域像元,最后利用估计函数建立了联合稀疏模型。Zhang 等14提出了局部约束稀疏表示方法,选择与字典原子中最相似的原子组成自适应字典进行稀疏表示。Peng 等15提出了局部自适应联合稀疏表示,将训练样本邻域的像元扩展到训练样本字典中构建了自适应字典。在上述的稀疏表示方法中字典原子的空间信息未得到有效的利用,Han 等16研究发现高光谱图像字典中除了光谱信息,还包含了空间信息。因此,本文提出了基于空谱字典的加权联合稀疏表示高光谱图像分类(SSD-WJSRC)算法。先使用熵率超像素分割(ERS)算法获得超像素分割图,再计算测试样本与字典原子之间的联合相似度,通过 K 最邻近法(KNN)算法选择相似度最高的原子,添加原子及其邻域作为新的空谱字典。对测试像元的超像素邻域使用不同的权重以降低邻域中不相关像元对联合稀疏表示模型的影响,再在空谱字典上构建联合稀疏表示模型计算稀疏表示系数,最后根据稀疏表示系数计算每一类重建残差,并将测试像元分类到重建残差最小的类别中。2稀疏表示高光谱分类高 光 谱 数 据 集 为X=x1 x2 xn xN RB N,其中B为光谱带的数目,N为像素数目。结构化收稿日期:2022-03-24;修回日期:2022-05-09;录用日期:2022-06-20;网络首发日期:2022-06-30通信作者:*0110002-2研究论文第 43 卷 第 1 期/2023 年 1 月/光学学报字 典 为D=d1d2dcdC,其 中dc=d()1cd()2cd()Ncc为第c类地物子字典,Nc为第c类地物字典原子数目,C为地物类别数目。如果测试像元x属于c类,那么x就能由子字典线性组合表示出,即x=d()1ca()1c+d()2ca()2c+d()Ncca()Ncc,(1)式中:ac是稀疏表示系数,满足稀疏性要求,只包含少数非零项,其中非零项表示对应字典原子的权重。对于未知类别的像元x,可以通过字典D的线性组合表示为x=d1a1+d2a2+dCaC=d1d2dCa1a2aCT=Da,(2)式中:a1aC为稀疏表示参数。在理想情况下,如果x属于第c类,则存在ai=0(i=1,2,C且i c),即只有对应类的稀疏向量项为非零项,其他项均为 0。稀疏表示参数的求解可以视为优化问题,即a?=arg minDa-xF,s.t.arow,0 K0,(3)式中:arg min()为求解参数最小函数;a?为稀疏系数矩阵;F为 Frobenius 范数;row,0为 0 范数,代表非零项的数目;K0是稀疏向量中非零项数目的上限(稀疏度)。稀疏表示参数可由正交匹配追踪(OMP)17算法得到,计算出稀疏表示参数后根据稀疏表示参数计算每一类重建残差,重建残差最小类别即为测试像素所属类别,为测试像素分配对应的地物标签后完成分类,即class(x)=arg min rc(x),(4)式中:class()为分类结果函数;rc(x)=x-dca?cF为利用第c类子字典对测试像元进行重构后得到的像元与测试像元之间的残差;a?c为 OMP算法得到的稀疏表示系数矩阵。3基于空谱字典的加权联合稀疏表示高光谱图像分类3.1空谱字典稀疏表示通常对测试像元的邻域空间信息更加关注,忽略了字典原子的空间信息。所提的基于空谱字典的加权联合稀疏表示高光谱图像分类算法改善了字典原子的空谱信息未得到充分利用的问题。所提高光谱图像分类方法的示意图如图 1所示。本文中的空谱字典的构造流程如下。首先,通过主成分分析(PCA)算法将高光谱图像降维到一维得到主成分图像,并在主成分图像上使用ERS 算法得到超像素分割标签图,超像素标签对应的区域为S=s1s2ss,其中s为超像素的个数。然后,计算测试像元x和字典原子d的联合相似度。测试像元x和字典原子d的空间坐标分别为Px=(xpixel,ypixel)和Pd=(xpixeld,ypixeld),待测像元x和字典原子d之间的空间距离的定义为Dpixel=()xpixel-xpixeld2+()ypixel-ypixeld2,(5)测试像元x和字典原子d之间的光谱距离的定义为Dspc=arc cos(xTdx2d2),(6)结合空间距离和光谱距离定义测试像元x和字典原子d之间的联合相似度,即Djoint=Dpixel+(1-)Dspc,(7)式中:是平衡系数,用于平衡空间信息与光谱信息之间的比重,其值通常在 01范围内。图 1所提高光谱图像分类方法示意图Fig.1Schematic diagram of proposed hyperspectral image classification method0110002-3研究论文第 43 卷 第 1 期/2023 年 1 月/光学学报接着,计算测试像元x和所有字典原子d之间的联合相似度Djoint,并将所有的联合相似度按照降序排列,选择前K个字典原子。最后,将前K个字典原子对应的超像素邻域中的像 元 作 为 子 字 典 加 入 到 空 谱 字 典Dlocal=SK,1SK,2SK,K中。3.2加权联合稀疏表示相邻的高光谱像元通常由相似的地物组成,故光谱信息相关性很高。因此,当光谱相似度低的像元加入到联合稀疏表示模型中时,对其赋予与光谱相似度高的像元相同的权重是不合适的。因此,邻域中的像元应该与测试像元权重不同,并且权重由测试像元与邻域像元之间的光谱相关性确定。对 于 测 试 像 元x所 在 超 像 素 区 域XP=x1x2xp xP,其中P为超像素内像元的数目,先计算测试像元与超像素邻域像元的光谱距离,并通过光谱距离确定字典原子的权重。测试像元与邻域像元之间的距离通常使用欧氏距离计算,使用高斯核能够捕捉非线性信息的距离来衡量样本之间的相似度。测试像元x与邻域像元xp之间的高斯核距离的定义为w(x,xp)=exp-x-xp22()22,(8)式中:是高斯核宽度,通过计算字典原子之间的平均欧氏距离得到。由于高斯核距离的取值范围为 01,故可以直接使用高斯核距离作为权重。的计算公式为=efxe-xf2P2,e f,(9)式中:e=1,P;f=1,P。然后,根据式(8)得到的距离信息对字典原子进行加权,得到加权邻域Xp=w1x1w2x2wPxP。获得的加权稀疏表示模型为a?=arg minDa-XPF,s.t.arow,0 K0。(10)最后,使用同步正交匹配追踪(SOMP)算法求解稀疏表示参数。加权联合稀疏表示算法具体步骤如图2所示。3.3基于空谱字典的加权稀疏表示高光谱图像分类使用联合相似度,利用测试样本与字典原子之间的光谱角距离和空间距离选择相似度更高的原子、空谱字典,能够有效地提高分类精度,减少稀疏表示的字典数目,降低计算量。只选择一定数目的字典原子作为空谱字典,但字典数目过少会导致字典不满足稀疏表示字典的过完备性,故需要对空谱字典进行扩展。由于高光谱图像有着丰富的光谱信息和空间信息,在邻域范围内像元具有同质性,光谱信息近似,故通过分割超像素的方法可以得到像元的同质区域,获取到像元的空间信息。空谱字典的扩展使用超像素邻域像元进行扩展,并利用字典的邻域空间信息。使用加权算法对超像素邻域进行加权,减少不相关像元对联合稀疏表示的影响,在空谱字典上构建加权联合稀疏表示模型,最终实现分类。基于空谱字典的加权联合稀疏表示高光谱图像分类方案的具体步骤如图 3所示。图 2加权联合稀疏表示算法Fig.2Weighted joint sparse representation0110002-4研究论文第 43 卷 第 1 期/2023 年 1 月/光学学报4实验分析在 高 光 谱 图 像 分 类 中 常 使 用 Indian Pines 和Salinas 数据集对所提高光谱分类方法的性能进行验证,并将所提方法与 KNN、SRC、局部约束稀疏表示(LSRC)14、基于空间预处理的高光谱图像分类联合稀疏表示(SP-JSRC)11和 HybridSN18进行仿真对比。采用的仿真条件:intel i5-8500,6核 6线程处理器,主频为 3 GHz,随机存取存储器(RAM)容量为 16 GB、仿真软件为 MATLAB2021a。仿真实验的评价标准使用总体分类准确度(OA)、平均准确度(AA)和 Kappa系数。4.1高光谱数据集说明Indian Pines数据集由 AVIRIS传感器在印第安纳州西北部的印第安松树试验场中收集得到,图像尺寸为145 pixel 145 pixel,且 包 括 224 个 光 谱 反 射 带。图 3基于空谱字典的加权联合稀疏表示高光谱图像分类Fig.3Weighted joint sparse representation hyperspectral image classification based on spatial-spectral dictionary0110002-5研究论文第 43 卷 第 1 期/2023 年 1 月/光学学报在实验中去除吸水波段后波段数目减少到 200个。该数据集包含 16个地物类别,其中大部分是不同的作物,如小麦、玉米和大豆等。Salinas数据集是由 224波段的AVIRIS 传感器在美国加州萨利纳斯山谷上空采集得到的,覆盖的区域包括512 217个像素。弃用了 20个水吸收波段,保留 204个有效光谱波段。该数据集一共包含16个地物类别,如蔬菜、土壤和葡萄园田等。4.2参数设置Indian Pines和 Salinas数据集的地物类别、训练样本数目和测试样本数目如表 1 和表 2 所示。在 Indian Pine