温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
Vis_NIR
光谱
传感
鲜食
葡萄
糖度
检测
系统
罗东杰
第 卷,第期 光谱学与光谱分析 ,年月 ,基于 光谱传感的鲜食葡萄糖度检测系统罗东杰,王勐,张小栓,肖新清中国农业大学工学院,北京 摘要糖度是影响鲜食葡萄品质与风味的关键因素,对其可溶性固形物 的检测具有切实需求。近年来,随着芯片级光谱传感器的生产技术趋于成熟,具有高精确性与稳定性的片上光谱传感器为可见近红外检测技术开辟了新的途径。设计、搭建、测试了一套体积小、易操作、低成本的用于鲜食葡萄糖度无损检测的光学系统。系统以两块搭载芯片级光谱分析技术的新一代可见近红外光谱传感器 (美国 半导体公司)为核心元件。每个 传感器具有个集成了纳米光干涉滤波器的数字光谱通道和一个可通过单芯片准确控制电流()的 光源。传感器光谱通道的中心波长范围 ;两个 光源的中心波长分别为 和 ,半峰全宽()为 。首先,运用此原型在避光环境下采集 颗巨峰葡萄浆果的光谱信息;用手持式 糖度仪检测样本 ()并计算基于分布的样本糖度真值 :与 。其次,针对样本原始光谱数据,采用 提取主成分,根据得分因子分布,剔除了 个位于置信区间外的异常样本;进一步采用一阶导数 ()、归一化 (,)与标准化 (,)种方式做数据预处理,求取样本在 个通道下的吸光度或 函数值()。针对可见近红外光谱自变量之间具有多重相关性、光谱信息与糖度信息之间非线性相关的特点,建立 神经网络糖度预测模型(自变量为吸光度或()值,因变量为 )。结果显示,当分布的置信概率为 、光谱预处理方式为 (,)、光谱信息指标为吸光度时所建立的预测模型精度最高:决定系数为 、均方根误差 为 、预测集偏差 为 、残留预测偏差 为 ,可认为模型具有较高精度与较好适应性对葡萄 做出预测。最后,结合实验结果,作了葡萄浆果 光谱检测原理的分子尺度分析:在各分子振动类型中,键伸缩振动的倍频、倍频,键剪式振动与伸缩振动倍频、倍频的合频,=键伸缩振动的倍频、倍频为可见近红外光谱检测的有效振动频率。该研究为未来工业与消费领域在线质量检测设备的高精度化、便携化、低成本化提拱了技术参考。关键词可见近红外技术;鲜食葡萄;可溶性固形物;智能光谱传感器;神经网络;偏最小二乘法中图分类号:文献标识码:()收稿日期:,修订日期:基金项目:科技部国家重点研发计划项目(),中国农业大学人才培育发展支持计划项目()资助作者简介:罗东杰,年生,中国农业大学工学院本科生 :通讯作者 :引言葡萄含有丰富的糖类、有机酸、维生素等成分。巨峰葡萄以酸甜可口、香气浓郁的特点为消费者所喜爱,而糖度直接影响着葡萄的口感与风味。糖度的常规检测方法是破坏性检测,而鲜食葡萄的糖度则需要无损检测。可见近红外无损检测技术,利用待测样品对光的特定吸收、反射而进行定量、定性分析,具有简便快速、无破坏性等优点。运用此技术,国内学者已对葡萄、苹果、梨、脐橙等多种水果进行了糖度无损检测的研究。近年来,利用可见近红外光谱技术在获取果蔬糖度的研究 中,国 内 学 者 用 到 的 光 谱 仪 有 、等,这些研究型设备价格昂贵、体积大,难以实现现场检测的需求。目前,也有学者使用 、等便携仪器,但同样成本较高。多通道片上光谱传感器作为一种全新光谱指纹获取解决方案,凭借其小尺寸、超低功耗的优势,为新一代光谱分析开辟了道路。与现有实验室级光谱分析仪相比,以光谱传感器为核心元件开发的新光谱设备具有显著价格优势(成本总计 元人民币),并且能轻松连接到移动设备或外部微控制器,在实验室外就能完成葡萄浆果的糖度检测。本工作针对葡萄浆果糖度检测的需求,应用芯片级可见近红外光谱传感器 ,设计了一种小尺寸、低成本的葡萄浆果糖度检测 设 备,建 立 结 合 偏 最 小 二 乘 法(,)的()神经网络糖度预测模型,实现了葡萄浆果糖度 的无损检测。光谱传感检测系统原型 可见近红外光学原型组成的微机电系统(,)分为光谱采集单元与系统控制单元(图)。光谱采集单元由两个并置的 传感器组成,系统控制单元由 控制器构成。传感器由光电二极管阵列、干涉滤波器、可编程电流 等元件组成。传感器具有个经过校准的光谱通道,用于可见光()与短波近红外()的光谱测量,其光谱响应范围为 ,各通道中心波长分别为 、;传感器尺寸为 ,栅格阵列封装为传感器提供了直径 的光圈,滤波器允许的入射光角度为 ,纳米光干涉滤波器使传感器具有极高的精确性和稳定性且不受使用时间和温度的影响;传感器所配备的 工作电流为 ,可通过单芯片准确控制,属于超低功耗传感器。系统控制单元为光谱采集单元提供工作电压,并控制其采集光谱数据,两单元之间采用 通信。控制器由上位机供电,与上位机之间采用串口通信。光谱传感检测系统原理如图所示。图系统基本结构 图光谱传感检测系统原型及其工作原理 光谱传感检测原理 漫反射原理漫反射光是从光源发出的光进入样品内部经多次反射、折射、衍射及吸收后返回样品表面的光。因此漫反射光是分析光与样品内部分子发生作用后的光,负载了样品的结构和组成信息。漫反射率定义为式()第期罗东杰等:基于 光谱传感的鲜食葡萄糖度检测系统 ()式()中,为样本漫反射光强,为空光路光强。漫反射的吸光度定义为()为减少或消除任何与波长有关的镜面反射效应,将漫反射率转换为 函数()()()式()中,为吸收系数,为散射系数,吸收系数与样品浓度的关系为()式()中,为摩尔吸光系数,函数关系见式()()()函数()与样本组分浓度的关系符合 定律。分子特征振动物质均有运动,按照量子力学 近似,振动能是分子运动能量形式之一,是量子化的。分子振动分为伸缩振动与弯曲振动,若分子振动时偶极矩发生变化,则该振动具有红外活性。分子能级跃迁所吸收的能量遵循关系式 (),式()中,为普朗克常数,是光的频率;分子振动能级是间隔为 的一系列值。当振动能态在相邻能级之间跃迁,即、时,是基频吸收,跃迁概率大;当振动能态跨能级跃迁,即、时,是倍频吸收,跃迁概率小。分子振动方式包含基频、倍频、合频振动,三种振动的频率分别为分子振动的固有频率、与基频成整数倍的倍频、伸缩振动与弯曲振动的复合频率。糖类分子中醇羟基键比较多,故特征峰为键的伸缩振动()和键的伸缩振动(),两种基团基频振动的实际吸收带 分别为:,:。糖分子中包含了羟基与羰基的不同倍频与合频振动,以及合频的倍频、倍频的合频等多种振动方式。这些振动包含了糖分子的主要结构与组成信息,该信息能加载于近红外光谱,使该谱区能够分析待加载样本所含羟基与羰基的多少进而得到待测样本糖度信息。以葡萄糖分子为例,分子的伸缩振动、剪式振动模型如图“”所示。实验部分 仪器与材料 光谱传感器(美国 半导体公司),开发板(上海 机器人公司);恒温箱(上海一恒科学仪器有限公司),手持式 糖度仪(日本 公司)。糖度测量具体操作参考 水果、蔬菜制品可溶性固形物含量的测定折射仪法 进行。本实验所用巨峰葡萄来自北京市丰台区,共 个样本,取于 串长势均匀、果皮颜色均匀、果实饱满的葡萄穗。光谱采集将葡萄样本在恒温箱中恒温 后在无光环境下进行光谱采集。采集光谱时,选择葡萄浆果的腰部,等间隔测个位点,以最大程度减小因葡萄表皮颜色、质地不均匀造成的 的 背 景 信 息 干 扰。将 传 感 器 的 频 率 设 定 为 ,等待监视器输出的数据稳定后再做数据采集,通常传感器扫描次便达达到稳定,即可采集数据。测定测量即存在误差。光谱采集完成后,迅速测定样本的 。测量值 与真值 之间存在误差且不可忽略,它们之间的关系表示为式()()当对 进行无数次测量后,测量值的算术平均值等于其真值,但因实际因素限制,一般只做有限次测量。基于分布样本 的真值可表示为:?,式中,表示次测量均值,表示置信概率为,自由度为()的分布(本实验);?表示 标准偏差的估计值,见式()?()()()分别选取置信概率为 、,表示出样本 的真值 ,分别记为:、,如图()所示。数据预处理采用 方法检测异常样本,对光谱的 个波段提取主成分,原始光谱信息被主成分替代,若某光谱样本得分因子与其他光谱差异大时,则认定该光谱样本为异常样本而剔除。根据 个样本的第一、第二主成分得分因子分布,共有 个样本差异较大位于置信区间之外,判定为异常样本,将其剔除。为消除基线漂移、减弱背景信息、减少系统误差,分别对将 吸 光 度和()值 进 行 一 阶 导 数、归 一 化 到(,)区间、标准化为(,)处理。样本集的划分将 个样本按照的比例划分为校正集和预测集,统计结果如表所示。所划分的 校正集数据相较于预测集范围更广、差异更大、更具代表性,在此基础上建立的预测模型适应性更好、精度更高。表划分样本集的数据统计 ()光谱学与光谱分析第 卷表特征波数向量 ()(,)(,)()(,)(,):;(,):;(,):;:偏最小二乘法 因同一基团存在合频、倍频、合频的倍频、倍频的合频以及费米共振等多种振动方式,导致有机分子官能团中某一基团在检测设备的多个光谱通道均有表达,因此近红外光谱分析中自变量之间具有多重相关性。偏最小二乘法(,)是由 等 年提出的一种用于多变量回归建模的方法,可在高维自变量空间中找到一个低维自变量子空间,使其对因变量有更强的解释性。多元线性回归 与主成分回归 是 原理的两大基石。多元线性回归 可以表示为()式()中,、分别为自变量与因变量矩阵,为回归系数矩阵,为残差矩阵。应用最小二乘法可获得,见式()()()当()不存在时,就会出现变量的多重相关问题。主成分分析(,)通过对原始数据空间进行变量转换得到一个映射空间,此空间中各统计向量是相互正交的,消除了变量之间的关联性,解决了变量的多重相关问题。主成分回归()可以表示为:,其中就是通过 获得的得分矩阵。偏最小二乘法()建模就是对自变量矩阵、因变量矩阵进行如式()分解 ()式()中,和为得分矩阵,和分别为和的负载矩阵,和为残差矩阵。通过迭代算法,最终的回归模型可以表示为:。神经网络近红外光谱信息中承载着不止糖类的浓度信息;另一方面,光谱中还叠加着各种较强的背景信息。因此,糖度与光谱数据之间呈非线性相关。()神经网络是由 、等 年提出的由反向误差传播算法训练得到的一种多层前馈人工神经网络。神经网络运用“有监督式”学习机制,通过最小化均方误差(,)和梯度下降法()来修改各层神经元的权值和阈值,迭代训练出具有高精度的输入与输出间的非线性映射网络。预测模型评价指标预测模型的准确性和稳定性评估指标为决定系 数()、均方根误差(,)、预测集偏差()和残余预测偏差(,)。,分别为校正集与预测集决定系数;,分别为校正集、预测集样本数量;为化学检测值,?为均值,?为预测值;,分别为校正集、预测集均方根误差;等定义了个质量类别以考虑模型的可靠性,分别是:,不可靠模型;,可靠模型;,优秀模型;为预测集样本标准差;统计指标计算公式如式()式()。(?)(?)(?)()(?)(?)(?)()(?)(?)()(?)()最 终,一 个 具 有 较 高,以 及 较 低 ,且 与 值差别细微的预测模型可实现高鲁棒性、高精确度与较好稳定性的葡萄浆果 预测。第期罗东杰等:基于 光谱传感的鲜食葡萄糖度检测系统结果与讨论 原始光谱图传感器、的 光源波数分别为 和 图()中;因传感器波数为 的光源在 的光谱通道上的空光路反射强度极弱,视为冗余信息,故舍去该通道数据。用于建立预测模型的校正集的样本 最小值与最大值分别为 与 ,极差为 (),将校正集中的样本按照样糖度 的大小进行排列,图样本原始光谱 分别选取具有代表性的三个 区间段(:,:,:,每段均为连续 个样本的平均值),各段的原始光谱信息(漫反射率)如图所示。建立预测模型首先,经 处理得到不同波数下光谱数据与糖度 的相关系数。每个样本包含了 个波数上的光谱信息,形成一个 维的特征波数向量(表)(,)将光谱信息自变量矩阵与特征波数向量相对应的值相乘得到新的自变量矩阵,作为 神经网络的输入层,作为输出层,建立 输入输出的 神经网络糖度预测模型。通过 神经网络训练得到个不同的预测网络,将预测集的自变量矩阵作为预测网络的输入对预测集 值进行预测。模型评价与结果比较由种光谱指标 吸光度与 函数值()、种与预理方式(