第43卷,第3期光谱学与光谱分析Vol.43,No.3,pp744-7522023年3月SpectroscopyandSpectralAnalysisMarch,2023降维降噪处理对番茄早疫病潜育期高光谱识别效果的影响胡政1,张艳1,2*1.贵州大学大数据与信息工程学院,贵州贵阳5500252.贵阳学院农产品无损检测工程研究中心,贵州贵阳550005摘要番茄早疫病感染性强、破坏性大,潜育期症前特征的检测识别是番茄早疫病监测预警和科学防治的关键。在实验室以离体番茄叶片作为研究对象,利用高光谱图像监测番茄叶片早疫病的病程演变情况,结合可见光图像和光谱特征进行数据分析。实验发现,番茄叶片感染早疫病后其近红外光谱平均值和红边反射率随着时间不断降低,且在接种36h时已出现潜育期病症信息。选择接种36h的光谱数据作为番茄早疫病潜育期的建模数据,分别利用了主成分(PCA)变换、多元散射校正(MSC)对建模数据进行光谱降维或降噪处理,进而建立梯度提升决策树(GBDT)和支持向量机(SVM)识别模型,并导入数据进行训练识别。讨论了PCA和MSC的预处理方法对梯度提升决策树(GBDT)和支持向量机(SVM)模型识别效果的影响;进一步讨论常见核函数对SVM识别模型的影响,优选出预处理方法和识别模型的组合算法。结果发现,PCA-GBDT、PCA-SVM(高斯核)、PCA-SVM(线性核)、MSC-GBDT、MSC-SVM(多项式核)这几类组合算法准确率均为95%以上,能很好的实现番茄早疫病潜育期的光谱识别;其中MSC-GBDT的识别召回率和准确率最好,而PCA-SVM(高斯核)识别效率最高。研究表明,通过降噪处理后的番茄早疫病潜育期高光谱数据减少了噪声、更加符合真实的分布、具有较大的可信数据量,配合简单的识别模型会导致识别能力不足,而配合复杂的识别模型可达到一个较可靠的测试结果;通过降维算法能使番茄早疫病潜育期高光谱数据的维度降低、数据量减少;降维后的特征能够表达出病变信息,配合简单识别模型时识别效果好,而配合过于复杂的识别模型会导致识别模型的过拟合。关键词番茄早疫病;潜育期;高光谱成像;预处理;支持向量;梯度提升决策树中图分类号:O433.4文献标识码:ADOI:10.3964/j.issn.1000-0593(2023)03-0744-09收稿日期:2022-01-29,修订日期...