温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
深度
学习
SVM
吸毒
成瘾
识别
王媛媛
第 46 卷 第 1 期2023 年 2 月电 子 器 件Chinese Journal of Electron DevicesVol.46No.1Feb 2023项目来源:国家自然科学基金资助项目(62076215);江苏省高等学校自然科学研究重大项目资助(19KJA110002)收稿日期:20220403修改日期:20220613Identification of Drug Addicts by Deep Learning and SVM*WANG Yuanyuan1*,XU Yide2,WANG Xinyu1,TIAN Bin3,WANG Kuiwen3,ZHOU Feng1(1School of Information Technology,Yancheng Institute of Technology,Yancheng Jiangsu 224051,China;2School of Information Science and Engineering,Southeast University,Nanjing Jiangsu 210096,China;3Jiangsu Fangqiang Compulsory Isolated Detoxification Center,Yancheng Jiangsu 224165,China)Abstract:A neural network model using PCA and linear discriminator is proposed to identify addiction level and community correctiontime of drug addicts according to facial images as well as local information in abstract features through deep learning method Firstly,thebackbone network esNet50 is pre-trained Then,PCA is used to reduce the number of features and the Fisher discriminator is used forpre-discrimination,so that,the training time of the model is reduced and feature extraction is more accurate and faster Finally,the net-work end is classified through the combination of the fully connected layer and the SVM function Cross-entropy loss is adopted as theoptimization goal of stochastic gradient descent The experimental results show that the method has a recognition accuracy of 8174%forthe degree of drug addiction and 6059%for the community correction timeKey words:deep Learning;neural networks;PCA;fisher s linear discriminantEEACC:6135doi:103969/jissn10059490202301020基于深度学习与 SVM 的吸毒成瘾者识别*王媛媛1*,徐一得2,王新宇1,田彬3,王奎文3,周锋1(1盐城工学院信息工程学院,江苏 盐城 224051;2东南大学信息科学与工程学院,江苏 南京 210096;3江苏省方强强制隔离戒毒所,江苏 盐城 224165)摘要:提出一种使用 PCA 和线性判别器的神经网络模型,利用深度学习方法通过面部图像及抽象特征中的局部信息识别吸毒成瘾者的成瘾程度和社区矫正时间。首先对主干网络 esNet50 进行预训练;再使用 PCA 降低特征数、Fisher 判别器进行预判,从而使模型的训练时间减少、特征提取更加准确和快捷;最后网络末端通过全连接层与 SVM 函数的组合进行分类。随机梯度下降的优化目标采用了交叉熵损失。实验表明,此方法对于吸毒成瘾程度的识别准确度可达 8174%,对于社区矫正时间的识别准确率可达 6059%。关键词:深度学习;神经网络;PCA;Fisher 判别器中图分类号:TP181文献标识码:A文章编号:10059490(2023)01011506非法药物的滥用已成为当今社会重要的健康和公共安全问题,常见的非法药物包括大麻、可卡因或苯丙胺类兴奋剂。药物成瘾者的生物特征受到药物的影响产生急剧的改变12,例如长期滥用苯丙胺类兴奋剂和海洛因将导致皮肤溃疡和脂肪组织结构的损失,此外肤色差、脱发等症状也常见于药物成瘾人群,如图 1 所示。这些特征大多集中在面部区域,本文的目标则是利用深度学习方法,使神经网络能够学习到面部的图像特征,并快速准确地完成识别。尽管深度学习已经经过多年的发展,有关的面部识别技术也已在多个领域成熟应用,但经调研,基于机器学习或深度学习的吸毒成瘾者识别的研究为数不多。在国外,aghavendra 等4 创建了一个新的人脸数据库,被称为药物滥用数据库(Drug AbuseDatabase,DAD),由从 101 名受试者那里获得的药物样本来自 Face of Meth3 图 1非法药物对面部的影响滥用之前和之后的图像组成;Svetlana Y 等人5 研究了利用“软”人脸生物特征能否检测长期吸毒痕迹的问题;Yadav 等人6 提出了一个基于投影字典学习的非法药物滥用脸部分类框架,通过预先裁剪出包括颧骨、双眼和脸颊在内的 OI 区域并提取多尺度二值统电子器件第 46 卷计图 像 特 征(Binarized Statistical Image Features,BSIF)和 gist 特征进行分类,在自行采集的数据中实现了 8881%的准确率;Priambodo 等人7 利用局部二值模式(Local Binary Pattern,LBP)作为特征描述子并自行制作了包含 30 张吸毒者吸毒前后面部变化图像的数据集,实现了 75%的识别准确率;Gupta 等人8 设计了一种基于神经网络与支持向量机(SupportVector Machine,SVM)的吸毒者识别框架;Hadjahmadi等9 提出了从语音中自动诊断毒瘾的思想,为毒瘾的诊断提供了一种舒适、隐秘、远程的检测方法。本文提出了一种完全基于神经网络的新方法,且无需根据先验信息预先处理面部,而是通过使用 PCA 降低特征维数和 Fisher 判别器进行预先判别,使模型的训练时间减少,并使特征提取更加准确快捷,进而完成对成瘾程度和吸毒人员矫正时间的识别。1使用 SVM 和 PCA 吸毒成瘾者识别框架在这项研究中,提出了一种使用 PCA 和线性判别器的的神经网络模型,以深度残差网络 esNet50作为主干网络,利用面部信息检测药物滥用的影响,例如甲基苯丙胺和海洛因。这一框架的新颖性主要在于避免了依据先验信息进行的手工图像特征提取,尽管水疱、组织脱落、脱发、肤色差异等症状往往被认为是区分成瘾者与非成瘾者的重要特征,但现有的研究大多通过图像处理手段对上述特征进行裁剪量化并综合推断,考虑到这些特征的单独和整体性,这一判别模式的准确率与鲁棒性往往不尽人意。而本文尝试采取PCA 来减少计算的特征数量,以及线性鉴别器进行初步分类的模式,令网络快速学习出图形中需要提取的重要特征并加以利用。框架的主体结构如图 2 所示,待检测的人脸首先经过人脸检测与对齐,消除面部之外的噪声区域,随后输入主干网络提取特征,其结构参考 esNet5010 的超参数设置;在 esNet50 输出后送入 PCA 和线性鉴别器中,这将在 11 小节和 12 小节进行阐述;最终由全连接层结合 SVM 函数输出对应人脸的分类结果,判别为成瘾者、轻度成瘾者或重度成瘾者。该框架是一个端对端的结构,易于训练和部署。在人脸检测与对齐阶段,我们采用开源的 C+机器学习工具箱 Dlib11 完成这一任务,Dlib 能够输出画面中人脸的定位坐标以及 68 个关键点的位置,如图 3 所示。在裁剪出人脸区域后,为避免头部角度对识别结果的影响,通过旋转将 37 号左眼角与46 号右眼角置于同一水平线上完成人脸对齐。面部图像中包含的能够判别被试是否为成瘾者的信息由 CNN 编码为抽象特征,在这一过程中,PCA 可大量减少计算量,保证了网络能够快速学习出图形中需要提取的重要特征。图 2非法药物滥用检测框架图 368 个面部关键点12主成分分析主成分分析方法(Principal Component Analysis,PCA)是一种使用最广泛的数据降维算法。PCA 的主要思想是将 n 维(不同维度的数据之间存在数据冗余)特征映射到 n维上,这 n维是全新的正交特征,也被称为主成分,是在原有 n 维特征的基础上重新构造出来的 n维特征。PCA 的工作就是从原始的空间中顺序地找一组相互正交的坐标轴,新坐标轴的选择与数据本身是密切相关的。其中,第 1 个新坐标轴选择是原始数据中方差最大的方向,第 2 个新坐标轴的选取是与第1 个坐标轴正交的平面中使得方差最大的,第 3 个轴是与第1、2 个轴正交的平面中方差最大的依次类推,可以得到 n 个这样的坐标轴。通过这种方式获得的新的坐标轴,我们发现,大部分方差都包含在前面n个坐标轴中,后面的坐标轴所含的方差几乎为 0。于是,我们可以忽略余下的坐标轴,只保留前面 n个含有绝大部分方差的坐标轴。事实上,这相当于只保留包含绝大部分方差的特征维度,而忽略包含方差几乎为 0的特征维度,实现对数据特征的降维处理。611第 1 期王媛媛,徐一得等:基于深度学习与 SVM 的吸毒成瘾者识别有 mn 维数据(x(1),x(2),x(m),对其去中心化使mi=1x(i)=0。设新坐标系正交基为 w1,w2,wn,w2=1,wTiwj=0。则有新坐标系的样本 WTX,样本点 x(i)在 n维坐标系中的投影为:z(i)=(z(i)1,z(i)2,z(i)n),其中,z(i)j=wTjx(i)。在新坐标系中的投影方差为 WTx(i)x(i)TW。要使所有样本的投影方差和最大,也就是最大化mi=1WTx(i)x(i)TW,即:arg maxWtr(WTXXTW)st WTW=1(1)利用拉格朗日函数可以得到J(W)=tr(WTXXTW)+(WTW1)(2)对 W 求导可得:XXTW=W(3)而上式即是一个方阵的特征分解公式 Av=v。式(3)中,XXT是方阵,W 是特征向量,是特征值。于是上面求解的问题转化为求协方差矩阵的特征值和特征向量。特征向量即是新坐标系正交基,特征值指示的是变化程度,特征值大表示变换后离散程度高、方差大。因此,获取特征值和特征向量后,取特征值按大小排列取 n个,其对应的特征向量组成矩阵 W,于是新坐标 z(i)=WTx(i)。图 4PCA 误差示意图有时候,可以不用指定降维后的 n的值,而是指定降维后的主成分比重的阈值 t,t(0,1 之间。假定 n 个特征值的关系是 12in,则n的值可以从式(4)求出:ni=1ini=1i t(4)经过 PCA 降维后,总会有误差产生,如图 4 所示。通常使用式(5)来判断误差是否符合范围。Loss=1mmi=1x(i)x(i)approx21mmi=1x(i)2 001(5)式中:分子表示平均投影误差的平方,即原始值和重构值之间差的平方的平均值;分母表示原始数据的总变差。当误差小于 001,说明降维后的数据能够保留 99%以上的信息。这