分享
半监督空谱局部判别分析的高光谱影像特征提取.pdf
下载文档

ID:3633875

大小:19.37MB

页数:15页

格式:PDF

时间:2024-06-26

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
监督 局部 判别分析 光谱 影像 特征 提取
第 39 卷 第 2 期2024 年 2 月Vol.39 No.2Feb.2024液晶与显示Chinese Journal of Liquid Crystals and Displays半监督空谱局部判别分析的高光谱影像特征提取吕欢欢1,2,黄煜铖1,张辉2*,王雅莉1(1.辽宁工程技术大学 软件学院,辽宁 葫芦岛 125105;2.湖州师范学院 信息工程学院,浙江 湖州 313000)摘要:为充分利用高光谱影像中蕴含的空谱特征,提出了一种半监督空谱局部判别分析的高光谱影像特征提取算法(S4LFDA)。鉴于高光谱数据集具有空间一致性,首先将像元进行空间重构,保存高光谱数据的近邻关系;其次引入光谱信息散度重构像元间的相似度;为了充分利用大量无标签样本提高算法性能,采用模糊 C均值聚类算法对样本进行聚类分析得到伪标签;然后通过增加规范化项到局部力导引算法(FDA)的类内散度矩阵和类间散度矩阵中,以此保持无标签样本的聚类结构一致性;最后通过局部 FDA 算法来保持有标签样本类间散度最大化和类内散度最小化并求解最佳投影向量。S4LFDA 算法既保持了数据集在光谱域的可分性,又保持了像元在空间区域内的近邻关系,合理利用有标签样本及无标签样本,提高了算法的分类性能。在 Pavia University 和 Indian Pines数据集上进行实验,总体分类精度达到95.60%和 94.38%。与其他维数约简算法相比,该算法有效提高了地物分类性能。关键词:高光谱影像;半监督;空谱;判别分析;特征提取;地物分类中图分类号:TP751 文献标识码:A doi:10.37188/CJLCD.2023-0054Semi-supervised spatial spectral local discriminant analysis for hyperspectral image feature extractionL Huanhuan1,2,HUANG Yucheng1,ZHANG Hui2*,WANG Yali1(1.College of Software,Liaoning Technical University,Huludao 125105,China;2.College of Information Engineering,Huzhou University,Huzhou 313000,China)Abstract:Making full use of the spatial spectral features contained in hyperspectral images,a hyperspectral image feature extraction algorithm(S4LFDA)for semi-supervised spatial spectral local discriminant analysis is proposed.In view of the spatial consistency of hyperspectral datasets,the pixels are first spatially reconstructed to preserve the neighbor relationship of hyperspectral data,and the spectral information divergence is introduced to reconstruct the similarity between cells.In order to make full use of a large number of unlabeled samples to improve the performance of the algorithm,the fuzzy C-means clustering algorithm is used to cluster the samples to obtain pseudo-labels.Then,the normalization term is added to the intra-class divergence matrix and interclass divergence matrix of the local FDA algorithm to maintain the consistency of the cluster structure of the unlabeled samples.Finally,the local FDA algorithm is used 文章编号:1007-2780(2024)02-0131-15收稿日期:2023-02-12;修订日期:2023-04-01.基金项目:浙江省教育厅一般科研项目(No.Y202248546)Supported by General Research Projects of Department of Education of Zhejiang(No.Y202248546)*通信联系人,E-mail:第 39 卷液晶与显示to maximize the interclass divergence and minimize the intra-class divergence of the labeled samples and solve the best projection vector.The S4LFDA algorithm not only maintains the divisibility of the data set in the spectral domain,but also maintains the neighbor relationship of the pixels in the spatial region,rationally uses labeled samples and unlabeled samples,and improves the classification performance of the algorithm.Experiments are carried out in Pavia University and Indian Pines,and the overall classification accuracy reaches to 95.60%and 94.38%,which effectively improves the performance of feature classification compared with other dimensional reduction algorithms.Key words:hyperspectral image;semi-supervision;spatial spectrum;discriminant analysis;feature extraction;feature classification1 引言高光谱遥感图像的波段通常连续且多达十个甚至数百个,光谱分辨率高,具有较强的地物分类和识别能力,目前广泛应用于环境监测、军事侦察和城市规划等领域1。但是现有的高光谱图像日益多元化且数据量呈指数级增长,波段间的相关性和冗余度高2,在地物进行分类任务时,易出现“维数灾难”3的问题。对高光谱图像进行特征提取是解决这个问题的途径之一。特征提取不仅可以降低波段间的相关性和冗余性,提高分类精度,而且能提升高光谱图像的处理效率以及减少空间存储的成本。特征提取算法按照数据结构可划分为基于全局结构的特征提取算法和基于局部结构的特征提取算法。主成分分析(Principal Component Analysis,PCA)4和线性判别式分析(Linear Discriminant Analysis,LDA)5都是经典的全局线性方法。PCA 以方差最大化准则寻求达到全局最佳逼近的投影方向,LDA考虑了有类标数据的类内和类间判别信息。这些方法只考虑了数据的统计性质,无法真正揭示高光谱数据集的非线性多模结构6。为了更好地分析数据内在属性,流形学习的发展揭示了数据的几何结构,代表性的算法为等距离映射7(ISOMAP)、局部线性嵌入8(LLE)和拉普拉斯特征映射9(LE)。它们是局部特征提取的主要算法,3 种方法都属于非线性投影且考虑了高维数据在低维空间中的某种局部特性来描述其内在流形,将样本外映射到相应的低维空间中,但无法给出具体的投影矩阵。为了解决样本的泛化性问题,将 LLE 和 LE线性化为局部保持投影(LPP)10和近邻保持嵌入(NPE)11,通过近邻图来揭示数据的局部近邻关系,在低维空间中也保持局部几何结构。基于图框架的观点,已经发展出许多先进的方法来更好地揭示数据的内在属性,如边界 Fisher分析12(MFA)、局部 Fisher 判别分析13(LFDA)、正则化 局 部 判 别 嵌 入14(RLDE)和 局 部 几 何 结 构Fisher分析15(LGSFA)等。上述算法都属于无监督算法或者有监督算法。无监督算法一般很难达到预期的结果,但可以发现隐藏的非线性结构的数据信息;有监督算法需要大量的标记样本,但是高光谱数据标记成本高并且不易获取。因此,结合有监督和无监督算法的半监督算法成为研究的热点话题。根据图学习理论,设计的半监督算法有半监督图学习(SEGL)16、半监督局部Fisher判别分析(SELF)17和半监督局部判别分析(SELD)18,它们都是在LDA 原理上构建起来的。考虑了数据的流形结构的算法即半监督子流形保留嵌入19(S3MPE)和半监督稀疏流形判别分析20(S3MDA),增强本征特征的表达。这些算法充分利用少量标记样本的判别信息来保持数据集的可分性,深入发掘未标记样本包含的局部流形结构信息或方差信息,提高了特征提取效果,提升了分类能力。上述算法仅利用了光谱数据,而忽略了高光谱中地物空间分布的特征。高光谱具有“图谱合一”的特点,空间相关性强,相邻像素点具有明显的光谱相关性,因此,学者们开始融合高光谱数据的光谱信息和空间信息来提高地物分类性能21。Chang等人在 SELD的基础上提出了 NNSELD22算法。侯榜焕等人通过加入空间近邻散度矩阵,提出了S3ELD 23 算法。黄鸿等人提出了一种半监督多图嵌入的高光谱影像特征提取算法(SSMGE)24,132第 2 期吕欢欢,等:半监督空谱局部判别分析的高光谱影像特征提取注重高维空间的位置关系,构建监督和非监督超图及普通图表征数据间的复杂几何结构。这些方法都注重流形重构过程中近邻点的空间信息,大多采用监督和无监督方法联合使用的方法,但是忽略了可利用的标记样本数过少的问题以及在低维空间矩阵中保持与原来同样的空间结构特性。鉴于以上问题,本文提出了一种半监督空谱局部判别分析的高光谱影像特征提取算法,通过利用高光谱的近邻像元的空间特征提升分类效果,主要思想是利用像素融合后重构的空谱特征,增加正则化项至类内类间散度保持无标记样本的空间一致性。为了获取无标签样本的聚类结构,算法首先采用模糊 C 均值聚类算法求解聚类伪标签。与其他聚类算法相比,该算法不需要将某类确定为哪类,通过迭代进行聚类筛选最终的聚类中心。算法的提出大幅降低了人工成本,融合后的像素有效利用了高光谱数据的空间信息,保持不同类的区分能力并进行有效降维。为了验证算法的有效性,在实验阶段通过不同算法在不同标记样本、不同维数下利用支持向量机(SVM)分类器进行分类操作,最后在 Pavia University和 Indian Pines数据集上进行实验验证,结果表明分类精度得到了进一步的提高。2 相关算法及构造2.1空间邻域信息构造假设含有n个d维数据的高光谱数据集为Xn=x1,x2,xi,xn,对 应 的 低 维 嵌 入 为Z=z1,z2,zi,zn,zi Rr且r 0,则u()qki=g=1c()d()xi,vk()qd()xi,vg()q2p-1-1.(17)若d(xi,vk)()q=0,则u()qki=1,且i g,u()qki=0。步骤三:更新聚类中心v()q+1;v()q+1k=i=1n()u()q+1kipxii=1n()u()q+1kip,k=1,2,c.(18)步骤四:若V()q-V()q+1,则终止算法并输出U()q和V()q+1,否则令q=q+1,转至步骤二。根据U()q或V()q+1,样本xi的类别可表示为max,uki,k=1,2,cmin,d(xi,vk)()q,k=1,2,c.(19)通过上述聚类算法,我们得到重构后像元集合Xn的类标签集合为cini=1。3.2正则化约束项构造本文通过FCM聚类算法对所有重构后的训练样本Xn进行聚类分析。聚类个数c不需要与类别数C相同,得到像元的聚类标签集合为cini=1,这能使其更好地适应多模态数据分布情况。根据以上表述构建局部聚类的类间散度Sulb和局部聚类的类内散度矩阵Sulw,描述方法可表示为:Sulb=12i,j=1nWulbi,j(xi-xj)(xi-xj)T,(20)Sulw=12i,j=1nWulwi,j(xi-xj)(xi-xj)T,(21)式(20)和式(21)中,Wulb、Wulw是n n的矩阵,可表示为:Wulbi,j=Aij()1/n-1/ncici=cj1/m ci cj0 otherwise,(22)Wulwi,j=Aij/nci ci=cj,0 ci cj0 otherwise,(23)式中,nci表示聚类cini=1中样本的数量。3.3半监督空谱局部判别分析为了合理应用高光谱具有无标签样本所含的结构信息,这里将上面两个正则项分别合并到空间 LFDA 算法的类间散度和类内散度中,合并后的半监督类间散度和类内散度矩阵可表示为:Ssslb=(1-)Sslb+Sulb,(24)Ssslw=(1-)Sslw+Sulw,(25)式中:Sslb、Sslw为空谱融合后有标签测试样本类间散度和类内散度矩阵,Sulb、Sulw为空谱融合后全体测试样本的聚类类间散度和聚类类内散度矩阵。0,1为半监督程度参数,用来控制有标签样本和无标签样本的重要性。半监督空谱LFDA算法优化目标函数可表示为:Hs4lfda=arg maxH Rd rtr(HTSsslbHHTSsslwH).(26)S4LFDA 的目标函数可以用式(26)的广义特征值问题进行求解运算:Ssslb=Ssslw.(27)假设广义特征值按降序排序如下:12r,最终,Hs4lfda可以表示为:135第 39 卷液晶与显示Hs4lfda=(1,2,r).(28)半监督空谱局部判别分析的高光谱影像特征提取算法的具体过程如下:输入:Xn Rd n为高光谱数据集训练样本集,n表示样本集合的大小,d为高维高光谱样本的维度,窗口大小为,模糊 C聚类的类别数为c,降维的维度为r。(1)对数据集按照空间窗口的大小进行像素融合。(2)求解空间像素融合后有标签样本类间散度矩阵和类内散度矩阵。(3)对空间融合后的全体训练样本进行模糊C均值聚类。(4)求解融合后全体训练样本的聚类类间散度和聚类类内散度。(5)求解广义特征值问题,得到对应的特征向量1,2,r。输出:低维数据Y=HTX。4 实验数据及设置4.1实验数据集为评估本文 S4LFDA 的分类性能,使用具有代表性的 Pavia University26和 Indian Pines27高光谱遥感数据集进行分类实验。Pavia University 数据集的图像是 2002 年由反射光学系统成像光谱仪获取得到,图像大小为 610 像 素 340 像 素,空 间 分 辨 率 为 1.3 m。包含了光谱范围内的 115 个波段,光谱分辨率为412 nm。去除噪声影响严重的波段后,剩余103个波段用于实验。该图像参考数据样本共计42 776 个,含有 9 类地物信息。其假彩色图像和真实地物信息如图 2所示。Indian Pines数据集的图像由 AVIRIS传感器在美国印第安纳州的一块印度松树测试地获得。图像大小为 145 像素145 像素,空间分辨率为20 m。包含了光谱范围内的 224 个波段,该图像参考数据样本共计 10 249 个,含有 16 类地物信息。其假彩色图像和真实地物信息如图 3所示。4.2实验设置为了验证本文方法的有效性,实验中选取Baseline、LPP、LFDA、SELF、基于混合因子分析的有监督和无监督的特征提取算法28(S2MFA)、RLDE 和基于 SLIC 超像素的稳健主成分分析29(SURPCA)与本文方法进行比较。其中 Baseline是直接利用原始光谱数据,LPP 是无监督特征提取方法,LFDA 是有监督特征提取方法,SELF、S2MFA、RLDE 和 SURPCA 是半监督特征提取方法。正则化参数在0,0.1,0.2,0.9,1.0中选取,达到SELF算法的分类精度最优。S2MFA中的参数混合成分数量M对 OA 不敏感,潜在因子设置在 2550 之间时保持稳定。RLDE 算法中空间窗口大小设置为 7,正则化参数设置为 0.7,空间均值滤波的滤波度设置为0=0.9。SURPCA 中超像素数在 100200之间选取为最优。为了确保对比实验的公平性,各种对比算法参数均通过交叉验证调到最佳,低维嵌入特征维数设置为 30。在特征提取时,在数据集中每类地物随机选(a)伪彩色图(a)False color image(b)真实地物图(b)Truth ground object mapAlfalfaCorn-notillCorn-mintillCornGrass-pastureGrass-treesGrass-pasture-mowedHay-windrowedOatsSoybean-notillSoybean-mintillSoybean-cleanWheatWoodsStone-steel-towers图 3Indian Pines数据集Fig.3Indian Pine datasetAsphaltMeadowsGravelTreesPainted metal sheetsBare soilBitumenSelf-Blocking bricksShadows(a)伪彩色图(a)False color image (b)真实地物图(b)Truth ground object map 图 2Pavia University数据集Fig.2Pavia University dataset136第 2 期吕欢欢,等:半监督空谱局部判别分析的高光谱影像特征提取取 10,20,30个标记样本,然后从剩余像元中随机选取 3 000 个无标记样本,用作训练样本组成训练样本集,剩余样本作为测试样本集。对于地物数量较少的样本最多选取 1/2 作为测试集,其中无监督和半监督方法采用整个训练集进行训练,而有监督方法只利用标记样本进行训练。首先通过训练数据集计算特征提取方法的投影矩阵,然后得到测试样本集的低维嵌入特征,最后采用支持向量机(SVM)分类器进行分类。采用总体分类精度(Overall Accuracy,OA)、平均分类精度(Average Accuracy,AA)和 Kappa系数作为分类结果的评价指标。为了保证实验结果的可靠性,实验在每种条件下重复进行 10次,并取 10次结果的平均值作为最终实验结果。4.3实验结果及分析4.3.1Pavia University 数据集上的实验结果及分析根据实验设置,各方法在 Pavia University 数据集上不同维数下的总体分类精度如图4所示,不同标记样本数量下的最优总体分类精度见表 1。由图 4可知,随着低维嵌入维数的增加,各方法的总体分类精度不断提高,并逐渐达到最优值,之后出现精度平稳或下降的现象。这是因为随着嵌入维数的增多,其所包含的地物判别特征越来越丰富,从而分类精度也相应提高;但当有足够多的特征来描述地物信息时,如果持续增加特征的维数,有可能引入噪声或冗余信息,导致分类精度不再提高,甚至出现下降现象。由图 4可知,本文算法在低维度的分类精度增长缓慢,但是在 1025维时,分类精度高于其他算法且分类精度略有上升,逐渐达到最高的分类精度。保留30 维特征时,每类算法都取得了最大的分类精度,符合高光谱分类的特点。表 1 表示维数约简至 30维时,各个算法的分类精度。由表 1可知:(1)随着标记样本数量的增加,各方法的总体分类精度也随之提高。这是因为训练样本越多,特征提取时从样本数据中获取的先验知识越丰富,进而提取出低维嵌入特征的判别能力越强,图 4不同算法在不同标记样本、不同维数下的分类精度。Fig.4Overall accuracies of different algorithms with different labeled samples in different dimensions表 1不同样本标记下各类算法的总体分类精度(平均精度标准差)Tab.1Overall classification accuracy of various algorithms under different sample markers(mean accuracystandard deviation)%标记样本51015202530Baseline64.792.8668.932.1974.611.8476.241.1281.711.0182.760.94LPP65.242.6371.372.2376.831.6479.331.8983.451.8585.071.07LFDA66.213.0273.682.6878.532.5481.242.2185.641.6787.530.96SELF68.122.4275.582.1781.771.4883.111.8787.931.1589.210.85S2MFA76.492.3878.732.8085.522.1487.421.1390.061.0991.980.59RLDE78.312.9880.422.6586.962.4888.872.0191.171.4793.641.21SURPCA79.892.1783.702.2687.661.4590.521.3192.451.1294.710.94S4LFDA80.762.4285.352.1888.701.5891.861.2793.601.0695.600.72137第 39 卷液晶与显示其分类结果越高。与其他算法相比,S4LFDA 算法的 10次实验的总体分类精度的平均值高于其他算法。S4LFDA 高出其他算法约 1%13%,且训练样本越少,相较于其他算法分类精度提高越明显。(2)各种特征提取方法在保留特征维数为 30的情况下,均可以获取最优的分类精度,并且分类精度都在一定程度上高于 Baseline 方法,说明了这些特征提取方法的有效性。(3)LFDA 由于利用了样本的类别信息,分类精度高于无监督特征提取 LPP方法,但低于其他几种半监督特征提取方法。这是因为半监督方法同时利用了有标记样本和无标记样本,有效解决了有标记样本不足的问题。(4)在其余几种半监督特征提取方法的比较中,对比 SELF、S2MFA、RLDE和 SURPCA可得,同一地物,除了 Asphalt,都有所提高。尤其是 Bitumen 的精度显著提高,因为这片区域具有集中分布的特点。本文算法对于成片状分布的区域有更高的分类精度,因为引入了空间信息并极小化保持投影空间的类别可分性,增强了在低维空间内的属于同一类别像元和同一空间像元的聚集性,从而提高了分类效果。(5)本文方法在不同的标记样本数目下,分类精度始终是最优的。这是因为该方法在低维嵌入时,充分挖掘了影像的空间信息,利用有标记样本极小化类内散度矩阵和极大化类间散度矩阵,保证了低维空间类别的可分性。同时利用聚类方法对无标记样本进行聚类,生成伪标记信息,构造无标记样本的类内和类间散度矩阵来约束原始局部 Fisher判别分析的目标函数,提高了特征的判别能力,改善了特征提取的结果。为探索各方法在各类地物上的分类性能,实验中随机在每类地物中选取 30个标记样本、300个无标记样本作为训练样本。对于地物数量较少的样本最多选取 1/2 作为测试集,剩余作为测试样本。表 2 为各方法在 Pavia University 数据集上每类地物的分类精度、总体分类精度(OA)、平均分类精度(AA)和 Kappa 系数的对比。由表 2可以看出,各方法对于大部分地物都有较好的区分度,相较于地物 Meadows和 Bitumen 识别的其他算法,本文算法的精度有显著提高,提高约6%40%,这表明本文提出的算法对于大片同种区域以及地物边缘化有着更明显的感知力。图 5 为其对应的分类结果图。可以看出,Bare Soil区域分类变得比其他算法更加光滑。4.3.2Indian Pines数据集上的实验结果及分析在Indian Pines数据集上也进行了相同的实验,图6表示不同对比算法在不同维度下的分类精度曲线,表 3表示每类算法对应的最高 OA精度。表 2Pavia University数据集上每类地物在不同算法下的分类精度Tab.2Classification accuracy of every feature under different algorithms in Pavia University dataset%序号123456789总体分类精度平均精度Kappa系数类别AsphaltMeadowsGravelTreesP-metal sheetsBare SoilBitumenS-Blocking BricksShadowsBaseline97.0592.0764.3582.8397.1662.5248.8282.1010082.7780.7777.58LPP91.4993.0163.7476.6695.3274.5254.7284.1199.8985.0781.5080.44LFDA95.2892.6568.2285.3594.8481.4957.1482.5110087.5384.1783.46SELF92.6896.3469.7879.0210085.0861.6184.8910089.2285.4985.82S2MFA97.3396.2860.7185.7986.3898.4982.8893.8191.0785.8288.0989.36RLDE84.0597.7091.5199.0110096.5770.1893.3993.5093.5891.7791.53SURPCA95.6198.4585.1788.0191.9589.5889.2494.7294.9194.5291.9692.77S4LFDA95.9698.6489.8789.5510089.9496.9694.2396.4395.6094.6294.17138第 2 期吕欢欢,等:半监督空谱局部判别分析的高光谱影像特征提取图 5Pavia University数据集上各类算法的分类识别图Fig.5Classification identification diagram of various algorithms on the Pavia University dataset图 6不同算法在不同标记样本、不同维数下的分类精度。Fig.6Overall accuracies of different algorithms with different labeled samples in different dimensions表 3不同样本标记下各类算法的总体分类精度(平均精度标准差)Tab.3Overall classification accuracy of various algorithms under different sample markers(mean accuracystandard deviation)%标记样本51015202530Baseline48.814.9656.612.3462.811.9266.242.6970.713.4178.231.86LPP61.093.6867.422.5370.832.7173.582.4276.591.9783.182.07LFDA63.212.7469.783.1274.532.9477.243.0980.642.1787.531.06SELF66.124.7272.693.1776.772.9181.112.6785.772.4589.071.56S2MFA71.492.8374.373.0879.522.4184.241.3187.602.0491.890.95RLDE76.313.7580.242.5684.692.8486.872.1089.711.7492.531.21SURPCA79.982.7182.072.6286.842.4589.522.1390.451.2193.210.49S4LFDA80.592.2484.532.8187.072.6691.681.7292.601.6094.380.83139第 39 卷液晶与显示不同算法对 Indian Pines 数据集各类地物的分类精度如表 4 所示。每类选取 30 个有标记样本,采用 SVM 分类器得到表 4 中数据结果。从表 4可以看出:表 4不同算法对 Indian Pines数据集各类地物的分类精度Tab.4Classification accuracies of every feature under different algoriyhms in Indian dataset%序号12345678910111213141516总体分类精度平均精度Kappa系数类别AlfalfaCorn-nilCorn-milCornGrass-ptGrass-treesGrass-pt-mdHay-wdOatsSbs-nilSbs-milSbs-cnWheatWoodsBGTDSSTBaseline72.5073.0768.6056.5989.0086.9180.0096.3460.0070.2377.2967.3195.3894.0867.75100.0078.7578.4475.72LPP96.5578.6876.8560.3284.7592.1773.5397.0181.2577.6381.9883.9991.0993.3172.34100.0083.3183.8480.96LFDA77.7880.9176.8069.4291.7095.0082.1494.8476.4782.4192.8774.2298.9297.8181.57100.0087.5385.8085.82SELF58.0084.3084.0574.8890.2189.6085.7197.4488.2485.6891.9683.1399.4597.4985.3598.6189.1687.1387.64S2MFA68.5788.8185.5187.7989.2297.6090.9195.84100.0085.2193.4287.89100.0097.1186.9298.5991.3690.8390.15RLDE87.5087.9988.1080.1294.1298.9375.0095.72100.0094.5295.9280.9298.8797.3086.7181.7292.6490.2191.60SURPCA85.7190.8193.9390.1797.3593.6586.6796.8185.7192.6694.6480.38100.0097.9190.22100.0093.3192.2992.37S4LFDA100.0091.6795.4295.8898.7896.2790.9199.76100.0094.2694.4989.38100.0099.2977.13100.0094.4195.2093.61图 7Indian Pines数据集上各类算法的分类识别图Fig.7Classification identification diagram of various algorithms on the Indian Pines dataset140第 2 期吕欢欢,等:半监督空谱局部判别分析的高光谱影像特征提取(1)与其他无监督算法相比。S4LFDA与LPP算法比对可知,前者的 OA 和 Kappa 系数都优于后者,本文算法有效地利用了样本的标记信息,提高了样本之间的相似度,显著提高了样本的分类效果,也验证了半监督思想的可行性和样本空间利用的重要性。(2)与 LFDA 算法相比。S4LFDA 与 LFDA算法比对可知,前者的 OA 和 Kappa 系数都优于后者,进一步验证了半监督思想以及利用空-谱信息构建权重关系的可行性,弥补了大量无标记样本无法利用的问题,充分发挥了算法中嵌入的无标记样本所包含结构信息的作用,使本文算法即使在训练标签样本较少的情况下,依然能获得很高的分类精度。(3)与其他监督算法相比。S4LFDA与SELF、S2MFA、RLDE、SURPCA 算法比对可知,除了第 6、7类地物,S4LFDA分类精度相较于其他算法都有所提高,尤其是第 12 类地物提高显著,比其他半监督算法高出9.55%20.84%。鉴于表现同谱异物现象在高光谱影像数据中,采用 S4LFDA算法提取后的分类精度高于 S2MFA、SURPCA。与其他算法对比得出:S4LFDA 可以全面考量每个样本的空间关联性、光谱相似性,在低维空间中影像数据的空间区分效果更好,从而得到的分类结果较好不同算法在 Indian Pines 上的分类结果图如图 7所示。本文算法噪声点少且大片区域地物较为光滑,地物 Woods 和 Soybean-mintill几乎没有错分点。其他算法不同地物正确分类的地物不尽相同,有利有弊,本文算法的地物分类精度更高。4.3.3空间邻域大小对总体分类精度的影响S4LFDA 算法利用了空间的一致性,将空间像元点重新融合成新的像元,因此邻域的大小与样本有着密切的关系。为探索本文方法参数中空间窗口对分类精度的影响。分别从 Pavia University和 Indian Pines数据集中每类地物选取15 个标记样本进行实验,其余作为测试样本,的取值范围设置为 3,5,7,9,11。可以从图 8 中观察到,随着窗口大小的增加,空间邻域内的像元逐渐增多,会引入更多不属于同一地物的像元,像元的融合向量偏离了同类地物的光谱特征,导致融合像元在低维空间投影时也偏离同类地物,所以精度会逐渐降低。例如 Pavia University 数据集的9类地物中大多呈现零散分布,地物砖块和地物沥青道路更呈现条状分布,所以选择较小的邻域空间包含空间较少,不易混入不同地物的像元,邻域空间的增大会使分类精度逐渐降低。4.3.4半监督系数对总体分类精度的影响半监督系数对总体分类精度的影响如图 9所示。由图 9 可知,随着半监督系数的增加,Pavia University和 Indian Pines数据集的地物分类精度呈现先增加后减少的趋势。这是由于随着半监督系数的增加,样本标记过拟合现象减弱,嵌入的无标记样本的信息逐渐增加,提供的空间结构信息愈来愈多,因此精度有所提高。但是随着半监督系数的增加,有标记样本系数的指导能力逐渐削减,无标记样本提供的信息有限,导致精度有所下降。图 8不同窗口大小下的分类精度Fig.8Classification accuracy under different window sizes图 9半监督系数对总体分类精度影响Fig.9Effect of semi-supervised coefficients on overall classification accuracy141第 39 卷液晶与显示4.3.5有无标记样本数目对总体分

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开