分享
基于人工智能的抑郁症辅助诊断方法_赵健.pdf
下载文档

ID:2518320

大小:1.43MB

页数:11页

格式:PDF

时间:2023-06-29

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 人工智能 抑郁症 辅助 诊断 方法 赵健
西北大学学报(自然科学版)年 月,第 卷第 期,()收稿日期:基金项目:国家自然科学基金();陕西省国际科技合作计划重点项目()第一作者:赵健,男,河北河间人,从事人工智能及其应用研究,。医疗与人工智能基于人工智能的抑郁症辅助诊断方法赵 健,周莉芸,武孟青,王雪珠,孟宪佳(西北大学 信息科学与技术学院,陕西 西安)摘要 抑郁症是当前高发的心理和精神疾病之一,传统诊断方式存在依赖医生经验的主观局限性,人工智能应用到抑郁症的检测中可以进行特定的数据分析,从而辅助提高心理与精神疾病的诊断效率。知识驱动的第一代抑郁症检测只能解决完全信息和结构化环境下的确定性问题,抑郁症相关特征的选择会直接影响识别结果;数据驱动的第二代抑郁症检测需要大量数据推动,仅依靠黑盒模型下得出的结果不够可信;第三代抑郁症检测通过信息融合,结合不同来源的异构信息,确保处理信息的高质量,充分利用前两代抑郁症分析系统各自的优势,手工提取的特征融合深度特征可以更好地挖掘到抑郁特征信息,决策融合具有很强的容错性,融合后的模型能增加结果的可靠度,更加全面地对抑郁症数据进行分析。该文对现有研究成果进行总结与分析,指出了人工智能抑郁症诊断研究未来的发展方向。关键词 人工智能;抑郁症诊断;机器学习;深度学习;信息融合中图分类号:,(,);,();抑郁症是一种伴有思维和行为异常的精神心理障碍疾病,有着高复发率、高致残率、高自杀率。据世界卫生组织报告数据显示,全球有超过.亿人患有抑郁症,并且近十年患者的增速约,预计到 年,抑郁症将上升为第一致残诱因。然而,在抑郁症患病高增长率的背景下,临床中对抑郁症的诊断主要是量表筛查和精神科医生问诊,常用的抑郁量表有很多,如汉密尔顿抑郁量表()、贝克自评抑郁量表()等,但这种方式的诊断结果依赖医生的经验以及患者的配合度,其误诊率也高居不下,根据中国抑郁障碍防治指南,重度抑郁症误诊率高达.。因此,迫切需要客观、高效、准确率高的辅助诊断方法。随着人工智能(,)的发展,已有大量研究将人工智能应用到抑郁症的辅助诊断预测中。知识驱动的第一代抑郁症诊断主要依靠机器学习,通过特征提取算法对语音信号、面部表情、脑电等信号提取表征抑郁的特征,结合机器学习算法,包括随机森林(,)、朴素贝叶斯(,)、高斯混合模型(,)、支持向量机模型(,)等构建抑郁识别模型进行预测。数据驱动的第二代抑郁症诊断主要使用深度学习网络,将抑郁症数据送入深度网络,例如卷积神经网络(,)、长短时记忆神经网络(,)、深度卷积神经网络(,)、深度残差回归卷积神经网络(,)等进行训练,从而对抑郁症进行预测。目前,已有的抑郁症辅助诊断研究能得到较高的准确率,但在基于机器学习的抑郁症诊断系统中,手工提取特征需要大量先验知识并且存在信息丢失的问题。而深度学习网络具有不可解释性,出于对医疗行业安全性考虑,对 的心理检测结果接受度不高,仅依靠深度网络得出的诊断结果无法应用到临床。本文系统性分析了第一代和第二代抑郁症诊断研究,总结了已有的抑郁症辅助诊断方法,思考并讨论抑郁症诊断的发展方向 第三代抑郁症辅助诊断系统。知识驱动的第一代抑郁症诊断第一代人工智能的本质是基于知识与经验的推理模型,用来模拟人类的理性智能,利用知识、算法和算力 要素构造,是知识驱动的,以机器学习为主。通过机器学习算法构建的抑郁症诊断模型,我们称为第一代抑郁症辅助诊断方法。.基于语音数据的抑郁症辅助诊断越来越多研究者从心理学角度发现,与正常群体比较,抑郁症患者存在着强烈的负性倾向认知和潜在的生理障碍,在语音声学特征方面存在音调较低、语速较慢、语调单一等特点。针对抑郁语音发声特点,提取出不同特征(如韵律、声源、共振峰和频谱)作为抑郁症的有效预测因子。等人利用梅尔频率倒谱系数()和共振峰特征,结合、模型,在 个抑郁患者构建的库上进行评估,识别正确率可达到,证实了语音特征可以作为抑郁症辅助诊断的有效检测指标。等人提取了声门、速度频谱、共振峰等 个语音特征,在评估抑郁症发病严 重 程 度 上 灵 敏 度 为.,特 异 性 为.。等人提出了 框架,并开发了应用程序,利用程序收集了简短的语音样本,将 ()、部署到 应用程序,并对 名志愿者进行测试,获得.的 分数,.的敏感度和.的特异性。等人提出一个集成逻辑回归模型,比较了、和逻辑回归()的分类效果,分析了、韵律、频谱和声门语音特征对于男性和女性在抑郁症识别的分类性能,发现女性使用频谱、韵律和 特征,男性使用韵律和频谱特征的分类效果好,该模型在女性和 男 性 数 据 集 上 分 别 达 到 了.和.的准确率。使用相同的方法,利用不同的特征,得出的结果大不相同,说明了抑郁症诊断的研究过程中特征的选取尤为重要。西北大学学报(自然科学版)第 卷.基于面部数据的抑郁症辅助诊断人脸面部表情是传递情感最直接的方式,研究发现,抑郁症患者在情绪失控或者陷入自我负性循环时,其面部表情具有垂目、皱眉、嘴角下拉等特点,表 整理了抑郁症常用面部特征。表 抑郁症检测常用面部特征 类型特征面部整体特征将面部或头部作为一个整体区域构建特征。主要包括面部坐标差、特征脸、光流、头部运动的时间序列、速度和加速度、点头摇头和歪头的平均值等区域特征基于嘴和眼睛区域上提取的特征。主要包括嘴角的角度、眼睑的运动、速度和加速度、眨眼的频率、扫视的延迟等动作单元特征()单元的不同组合能够反应一个人的面部表情,进而反应心理状态。主要包括强度、变化率、区域特征()、发生的概率等面部标记点特征从人脸选取一些标记点,根据标记点构造特征。主要包括距离、速度和加速度、上下眼睑的平均距离、中位值和标准差、等 徐路分析了患者与正常人在访谈过程中动作单元()的出现频次、变化速率、强度等特征,发现二者存在明显差异,并以此通过 进行分类,男性的抑郁识别率达到.、女性达到.。等人提取了位置特征、区域特征、动作单元等面部特征,分别针对女性和男性建立模型,采用朴素贝叶斯、支持向量机和随机森林进行分类,得到的准确率女性为.,男性为.,再次证实了从面部指标检测抑郁症是可行的,并且发现眉毛和嘴巴的贡献比面部其他部位多。等人则是在定位面部特征的基础上,通过 根据眼睛、眉毛和嘴角的运动变化对抑郁症进行分类,特征检测准确率为.,召回率为.。等人考虑到光照变化的影响,利用光照不变的局部二值模式()描述符对每一帧图像进行特征提取,用于人脸检测,与 共同用于构建抑郁水平检测的完整模型。.基于电生理数据的抑郁症辅助诊断近年来,电生理数据辅助抑郁症的诊断也得到大量研究。相关电生理信号主要包括脑电、心电、体温等,其中,脑电信号使用频率最高,包括脑电图(,)、脑磁图、眼动信号等。等人提出了一种基于脑电信号重建相空间和几何特征的抑郁检测方法,采用粒子群优化算法和 分类器进行特征选择与分类,实现了.的平均分类准确率。等人通过眼动信号中的瞳孔大小、注视位置、注视时间等特征,与机器学习算法相结合,建立抑郁症患者预测模型,准确率较高,且数据获取相对成本更低。等人提出一种有效的基于脑电图的空间信息抑郁症分类检测方法,向 名参与者(包括 名抑郁症患者和 名健康对照者)呈现相同的正面和负面情绪面部表情刺激,利用差分熵和遗传算法进行特征提取和选择,利用 进行分类,对积极刺激和消极刺激分别获得了.和.的分类结果。.基于多模态数据的抑郁症辅助诊断由于抑郁症的复杂性,仅使用单模态数据的模型可能会忽略个体差异对判决结果的影响。因此,在人工智能技术的抑郁症辅助诊断研究中,除了使用单一模态数据辅助抑郁症诊断,也有很多使用多模态数据进行诊断研究。多模态数据的抑郁症辅助诊断框图如图。图 第一代人工智能抑郁症诊断框图 第 期 赵健,等:基于人工智能的抑郁症诊断方法研究 等人从说话行为、眼睛活动和头部姿势提取特征,支持向量机用于多特征选择的分类,在 名抑郁症患者和 名健康对照受试者的数据集上,个体单模态分类准确率分别为语音、眼睛、头部,特征融合后的平均准确率达到,与单模态系统相比,融合后的准确率显著提高,证明了模态的互补性。等人提出了一种采用多智能体策略的多模态抑郁症检测方法,从生理和行为两个角度同时进行探索,融合了脑电图和声音信号,如图 所示。对受试者分别收集脑电图采集实验和面对面访谈数据,去除不相关的噪声信号,并从每个模态中提取适当的特征。将有效特征在每个模态上训练 个表征分类器,每个分类器获得自己的决策,使用多智能体策略相互交换决策信息。最后,将不同分类器的决策聚合为最终的检测结果。对 名受试者(名抑郁患者和 名正常对照组)的实验结果表明,所提出的多模态抑郁检测策略在准确性、评分和敏感性方面均优于单模态分类器。图 多智能体策略的多模态普遍抑郁检测 我们的研究团队提出了一种基于语音信号和面部图像序列的多模态融合算法进行抑郁症诊断。引入频谱减法增强抑郁语音信号,采用频谱法提取变异率大的音高频率特征和差异显著的共振峰特征,从时域和频域分析了不同情绪语音的短时间能量和频谱系数特征参数,建立了训练和识别模型。同时,实现了正交匹配追踪算法,获得了人脸测试样本的稀疏线性组合,以及基于声音和面部情绪比例的级联。基于融合语音和面部情绪抑郁检测算法的识别率已达到.,与仅使用语音模式相比提高了.,实验结果表明该方法是一种有效的抑郁症检测方法。知识驱动的第一代人工智能抑郁症诊断方法和人类一样基于知识进行推理,具有可解释性。但从原始数据(包括图像、语音、视频和文本)中获取知识主要靠人工,效率不高,并且机器学习的特征选择直接关系到情感识别结果的好坏,必须提取到足够多的与抑郁相关的特征才能有效地提高识别效果,而我们对抑郁症的认知不够充分,可能会导致数据的部分呈现,在一定程度上模型分类的效果会受到制约。随着对抑郁症发病机制的深入研究,对于抑郁指标的选取能够更加精准,与其他学科的合作对于抑郁症诊断系统的研究至关重要。今后仍需要开展大量临床研究来验证和完善这些客观指标,最终为抑郁症患者提供一个安全准确的诊断方法。数据驱动的第二代抑郁症诊断随着在神经网络模型和学习算法上取得重大进步,开启了以深度学习为基础的第二代人工智能的新纪元。第二代 利用数据、算法与算力 要素构造,是数据驱动的,以深度学习为主。通过深度学习网络构建的抑郁症诊断模型,我们称为第二代抑郁症辅助诊断方法。近年来,自动抑郁检测已经获得越来越多的关注,具有良好的性能,为抑郁诊断系统的临床应用奠定了基础。本文对现有诊断方法进行全面总结,根据所采用的数据类型,大致分为基于音频、视频和多模态数据的抑郁症辅助诊断方法。.基于音频数据的抑郁症辅助诊断 等人提出了一个深度听觉网络模型 ,从声音线索中挖掘抑郁表征,采用 和 编码抑郁识别的鉴别音频表西北大学学报(自然科学版)第 卷征。可以从原始波形中建模空间特征表示,而 可以从摩尔尺度滤波器组中学习短期和长期的特征表示。此外,在训练阶段引入随机抽样策略,减少样本分布不均匀所造成的偏差,平衡样本。在 数据集进行了评估,证明了该方法的有效性。等人提出了一个新的框架,该框架集成了挤压和激励()组件,以及时频通道注意()块,以代表有区别的时间戳、频带,此外,考虑到数据的时频属性,提出了一个时频通道向量化()块来形成张量。在 和 上进行验证,分别是.和.,解决了语音频谱的不同频带对抑郁检测贡献不均等问题。等人提出一个深层的 架构,使用预训练模型提取深度语音特征,并结合深度说话人识别()和语音情感识别()特征,利用可变长度语音的 算法,计算两个深度语音特征矩阵中分层多通道变化的协方差系数,和相关系数,获得协调特征(式中简记为)。针对训练样本有限且模型复杂度高容易过拟合的问题,采用层次化抑郁检测模型、深度语音协调特征及其模糊向量作为输入,回归区间作为约束条件,对抑 郁 症 严 重 程 度 进 行 预 测。该 方 法 在 和 基准测试数据集得到了的准确率。,(,)(),(,)()(,),(,),(,)()式中:()表示协方差运算;()表示关联操作;,为时滞多通道二进制矩阵;(,)为特征值集合;()表示矩阵的轨迹;(,)为总功率;(,)为熵。.基于视频数据的抑郁症辅助诊断对于抑郁

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开