分享
基于AW-OPS高光谱波长选择方法的羊肉新鲜度检测_赵停停.pdf
下载文档

ID:2367592

大小:1.03MB

页数:8页

格式:PDF

时间:2023-05-10

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 AW OPS 光谱 波长 选择 方法 羊肉 新鲜 检测 停停
第 卷,第期 光谱学与光谱分析 ,年月 ,基于 高光谱波长选择方法的羊肉新鲜度检测赵停停,王克俭,司永胜,淑英,何振学,王超,张志胜河北农业大学信息科学与技术学院,河北 保定 河北农业大学食品科技学院,河北 保定 河北省农业大数据重点实验室,河北 保定 摘要高光谱数据中不仅含有关键性信息还存在一些干扰信息和无效信息,带有干扰信息和无效信息的数据建立模型会降低效率和模型精度。从全波段数据中提取特征波长是提高关系模型精度的有效方法。有序预测选择()是一种依据信息向量选择有效波长变量的特征波长提取算法,在特征波长变量筛选方面表现了较好地性能。但由于建立模型时,没有去除重要性较低的变量,导致过多的无效变量参与到模型中,降低了模型的准确率。论文以羊肉高光谱数据作为研究对象,提出了一种改进的特征波长变量选择方法,基于信息向量和指数衰减函数的有序预测选择方法()对羊肉新鲜度进行检测,该算法通过光谱数据和理化值数据之间的关系来计算信息向量并对波长变量进行排序,采用指数衰减函数()通过多次迭代去除一些信息向量绝对值比较低的波长变量,最后在已获取的有效波长变量中逐渐增加波长点建立多元回归模型,选取交叉均方根误差()最小值的波长变量子集为特征波长变量。实验时,将 法和 法在选取特征波长变量后,分别构建羊肉 的偏最小二乘()关系模型,同时与全光谱波段 模型的效果相比较。结果表明:算法运行程序平均用时为 ,优选出 个特征波长变量,模型相关系数()平均为 ,均方根误差()平均为 ;而改进的有序预测选择法()运行程序平均用时为 ,优选出 特征波长变量,模型平均提升到 ,平均降低为 ;全光谱波长数目为 个波长变量,其 模型的平均为 ,平均为 。模型相较于 模型测试精度提高了 ,相较于全光谱 模型,测试精度提高了,证明 是一种有效特征波长变量筛选方法,提高了 模型精度和程序运行效率,降低了模型复杂度。关键词羊肉高光谱数据;信息向量;特征波长变量选择;法中图分类号:文献标识码:()收稿日期:,修订日期:基金项目:国家自然科学基金项目(),河北省现代农业产业技术体系产业创新团队品牌与产业加工岗位项目(),河北农业大学精准畜牧学科群建设项目()资助作者简介:赵停停,女,年生,河北农业大学信息科学与技术学院硕士研究生 :通讯作者 :;引言羊肉的肉质细腻、口味特别,所含有的脂肪、胆固醇含量相比于其他肉食类较少,同时具有驱寒取暖的作用。由于羊肉成本高,市面上的商贩为了谋取利益销售部分次新鲜羊肉甚至腐败羊肉,这种“以次充好”的问题需要应用技术手段有效地监管。挥发性盐基氮是检测羊肉新鲜度的重要指标之一。高光谱成像技术融合了计算机科学和化学计量学等多门学科,具有清晰度高、操作简便、非破坏性等优势,现已应用于农业、地质、医学、食品等多个领域。在高光谱数据构建关系模型后,由于光谱数据有数千条波长,波段是连续的,容易导致数据信息的冗余性,还有干扰信息,这都会影响模型的效果。因此,从高光谱全部波段变量中选取特征波长对提高模型的稳健性和测试能力有着重要意义。等 通 过 有 序 预 测 选 择 法(,)、间 隔 偏 最 小 二 乘(,)和 反 向 区 间 偏 最 小 二 乘(,)筛选木质素含量的关键性波长变量,采用偏最小二乘法建立多元回归模型对甘蔗不同部位木质素含量进行测试,结果表明 模型的测试精度最高,为最优模型。等 通过 算法筛选特征波长变量后,建立偏最小二乘模型对咖啡的成分进行测试;与遗传算法(,)相对比,算法可以有效地舍弃非信息性波长变量,降低模型误差。此外,等 通过 算法和粒子群算法(,)筛 选 特 征 波 长 变 量 后,建 立 和 模型测试石油的树脂、沥青、热燃烧值等含量,结果发现 模型可以更加准确地测试石油的含量。以上说明,算法在光谱数据降维方面有着较好的效果。尽管 算法可以较为有效地提取特征波长改进模型的测试结果,但不足之处是,算法运用有序波长变量建立多元回归模型时,没有去除信息不足和重要性比较低的变量,导致过多的无效变量参与到模型中,降低了模型的准确率,增加了模型的复杂性,且算法需要多次迭代才能遍历完光谱数据 集,加 大 了 数 据 运 行 的 时 间,降 低 了 程 序 运 行效率。综上,本工作对 算法进行了改进,将特征波长变量算法中信息变量与有序预测选择算法()和指数衰减函数()相结合,设计了 (,)。该算法通过光谱数据和理化值数据之间的关系来获取信息向量并对波长变量进行排序,在有序波长变量中采用指数衰减函数()去除信息向量绝对值较低的波长后,进而获取有效性高的波长变量。以冷鲜羊肉为研究对象,采用 算法进行特征波长变量选取,建立羊肉挥发性盐基氮值()的 关系模型,并与其他特征波长变量选择方法相比较,以证明 算法的有效性,为加强羊肉食品安全的监管提供技术支持。实验部分 材料用背脊和后腿部位的羊肉作样品,购于河北省保定市唐县常见的一种小尾寒羊。羊肉需要在 之内进行排酸处理,然后将样品立即装入到保温箱中运送到实验室。在无菌实验室把羊肉中的脂肪和肌膜去除,并用无菌手术刀进行切块处理,尽量保持羊肉样品表面平整,将样本装入到自封保鲜袋中置于恒温冰箱中储放,每份样本大约,大小约为 ,样本数量共计 个,如图所示。每隔 分别取出背脊肉样品和后腿肉样品各个,参照国标 标准测定羊肉新鲜度指标(值),实验天数共计。将称取 样本肉,切碎成肉糜放置锥形瓶中,量取 蒸馏水置于锥形瓶用玻璃棒搅拌,浸泡 后过滤。使用全自动凯氏定氮仪之前进行清洗、排废,仪器蒸馏时间为 ,量取 的样本肉滤液及 的氧化镁混悬液到消化管中,蒸馏时间为 ,用 标准盐酸溶液进行滴定终止,每个羊肉样本重复测 定 值 次,取 平 均 值 作 为 值 的 测定值。图实验样本 高光谱图像采集高光谱图像采集系统如图所示,系统主要包括:机、海洋光学()的微型光谱仪 (上海蔚海光学仪器有限公司)、入口狭缝、高功率卤钨灯的光源、的光栅、的相机和光谱定标白板等装置组成。光谱仪波长范围为 。在采集光谱图像之前需要对光谱仪参数进行设置:滑动平均宽度为、平均扫描次数为 次、积分时间为 、探头角度为、样本到镜头距离为。采集光谱图像数据的试验流程是:首先打开光源预热 ,镜头对准白板,把羊肉样本放在载物台上,设置羊肉样本到镜头间的距离进行图像扫描,整个试验操作过程都是在暗箱中完成。由于暗箱中电流有噪声、不稳定等原因对数据造成影响导致试验结果有误差,因此试验之前需要进行黑白校正。图高光谱图像采集系统 有序预测选择特征波长变量算法()算法采集羊肉样品在 波段范围的高光谱数据信息,共有 个波长,高光谱数据信息之间存在冗余性和共线性信息,特征波长筛选可以实现光谱数据降维,降低羊肉新鲜度模型的复杂度。是 提出了一种将信息向量与有序预测选择相结合的特征波长变量选择算法,具有简便和数据类型通用性强的特点。第期赵停停等:基于 高光谱波长选择方法的羊肉新鲜度检测 算法是通过信息向量获取一个包含光谱数据信息重要性高的波长变量;依据全波段光谱数据和 值数据之间的关系获得信息向量;获得所有信息向量及信息向量组合后,根据信息向量元素的相应绝对值对光谱矩阵的变量进行区分,绝对值越高,对应的变量越重要;从信息向量绝对值中对波长变量进行降序排序,通过定义一个初始变量子集来建立第一个多元回归模型,之后逐渐增加固定波长变量来建立新的多元回归模型,并计算每一个子集模型的交叉验证均方根误差()参数;最终选择特征波长变量是通过对比模型的 参数,最小 参数的模型具有最佳预测能力的波长变量及相对应的最佳信息向量被选择为特征波长。信息向量目前衡量波长变量的重要性由信息向量进行判断,常见的信息向量有回归系数向量()、变量投影重要性向量()、残差信息向量()、线性相关系数向量()、协方差向量()等。虽然特征波长选择方法和信息向量有很多种,但每种特征波长选择方法只采用其中一种信息向量作为波长变量重要性决策的依据,而忽略了其他信息向量对关系模型的影响,关系模型可能会出现过度拟合的现象。针对这种现象,将由多个信息向量及两两组合的信息向量判定变量重要性,两两组合的信息向量进行归一化处理,综合分析了多个信息向量对光谱数据的影响。信息向量是通过光谱数据和理化值数据之间的关系计算获得,用,和 值等来表示,这些数据可以衡量波长变量的重要性,计算如下:为回归系数向量,表示自变量(光谱数据)对因变量(理化值数据)的影响,可以通过偏最小二乘拟合计算得到()偏最小二乘的原理是维中的空间,其中每个列表示一个坐标轴。如果每个截面的一条线和一个方向由维超平面表示,则空间投影到正交轴上,同时投影的数据位置去解释空间的值使得方差最大。的绝对值越大,因变量受自变量的影响越大,选取绝对值比较大的波长变量,建模测试能力越强。为变量投影重要性向量,用来评价自变量(光谱数据)解释因变量(理化值数据)的重要性,根据解释能力的大小来选取自变量。(,)(,)()是基于 模型计算的信息向量。式()中为自变量光谱数据的数量,为 模型中潜在变量的数量,为第个主成分,(,)为主成分之间的相关系数对因变量的重要性,为特征向量的第个分量。若主成分解释因变量的能力越强,并且自变量对作用又大,代表自变量解释因变量的重要性较大。因此 绝对值越大,自变量的重要性越高,选取重要性较高的波长变量建立模型,提高模型的准确率。为残差信息向量,用来度量原始光谱与重建光谱之间的差异,其中包含光谱变量的重要相关信息。()()在建立 模型时,可以根据 的主成分获得一个重构矩阵,其中重构矩阵包含了 模型所需要的相关信息,被去除的信息视为残差矩阵。式()中为残差矩阵的第列向量,残差平方和值越小,值就越大,代表残差矩阵的第列有价值的变量越多,选择有价值的变量组成一个集合建立模型,降低模型误差。为线性相关系数向量,用来评价自变量(光谱数据)和因变量(理化值数据)之间的线性相关的向量。(?)(?)(?)(?)()式()中为第个自变量,?为变量的平均值,为第个因变量,?为变量的平均值。的绝对值越大,包含模型的有效信息越多,选择绝对值较大的变量参与建模,提高模型精度。为协方差向量,表示协方差矩阵的对角线值,用来衡量两个变量之间的总体误差。()()通过偏最小二乘法计算得到的信息向量,式()中 为矩阵中的对角线值,各个变量的对角线值便构成了协方差向量,协方差值越大,两个变量之间相关性越强,用这些值的变量建立模型,提高模型精度。为权重向量,通过非线性迭代偏最小二乘算法获得的权重向量,选取比较大的 绝对值的波长变量参与建立模型中,降低模型的复杂性。改进的有序预测选择特征波长变量算法()对 算法的改进在 算法中,建立模型前没有去除重要性比较低和信息不足的变量,导致过多的无效变量参与到模型中,使模型具有较大的复杂性,降低了模型的准确率,针对这点,对 算法进行改进。为了降低模型的复杂度,提高模型的测试精度,提出了一种基于 信 息 向 量 和 指 数衰减函数的有序预测选择 算 法()。算法在有序波长变量中采用指数衰减函数()进行强制去除信息向量绝对值比较低的变量后(波长变量重要性比较低的波长)来构建多元回归模型。指数衰减方法优选的波长变量倘若尚未去除信息向量绝对值比较低的变量参与到建立模型中,会增加模型的复杂性,也会影响模型的效果。本工作的改进是:在有序波长变量中采用指数衰减函数()进行删除一些重要性比较低和信息不足的波长变量,然后再构建模型。每次迭代保留率并不是一样,最初,含有信息向量绝对值比较低的波长变量将会被迅速去除,这阶段称作“粗略选择”。随着信息向量绝对值比较低的波长变量的减少,去除速度会降低,为了避免波长变量重要性高的光谱学与光谱分析第 卷变量被去除,这是一个“精准选择”的阶段。因此使用指数衰减函数()来强制去除信息向量绝对值比较低的变量,这样可以节省数据的运行时间,降低模型的复杂性。在指数衰减函数()运行过程中为了避免光谱变量信息的丢失,设置了至少 的波长变量保留率。波长变量保留率的定义为()()()()()()式()中,为迭代次数(,),可以设置为 的迭代次数。为变量总数。其中和分别是第

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开