温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
机器
学习
不良
心血管
事件
诊断
中的
应用
综述
盼盼
第 22卷 第 2期2023年 2月Vol.22 No.2Feb.2023软 件 导 刊Software Guide机器学习在不良心血管事件诊断中的应用综述柯盼盼,陈胜,李珂然(上海理工大学 光电信息与计算机工程学院,上海 200093)摘要:急性冠状动脉综合征是由冠状动脉血流减少引起的一种急性严重综合征,是造成全球范围内患者死亡和长期严重残疾的重要原因,因此预测不良心血管事件对患者的风险排查、早期诊断和治疗等有着重要价值。机器学习可以探索新的可能性,揭示患者信息统计大数据中的隐藏关系,将对心血管疾病的辅助诊断和预后分析产生积极影响。阐述临床常用的风险评分工具,介绍其主要依赖患者的各项生理健康指标、既往病史等因素以及采用Cox回归模型进行高风险因素快速筛选的能力。回顾不同机器学习模型在急性冠脉综合征患者风险评估中的应用及其在预测长短期不良心血管事件中的特点和能力,并对机器学习算法在医学数据中应用的广阔前景进行展望。关键词:急性冠脉综合征;不良心血管事件;机器学习;大数据;辅助诊断DOI:10.11907/rjdk.221196开 放 科 学(资 源 服 务)标 识 码(OSID):中图分类号:TP181 文献标识码:A文章编号:1672-7800(2023)002-0212-06Review of Application of Machine Learning in the Diagnosis of Adverse Cardiovascular EventsKE Pan-pan,CHEN Sheng,LI Ke-ran(School of Optical-Electrical and Computer Engineering,University of Shanghai for Science and Technology,Shanghai 200093,China)Abstract:Acute coronary syndrome is an acute severe syndrome caused by the decrease of coronary blood flow.It is an important cause of death and long-term severe disability in patients all over the world.Predicting adverse cardiovascular events is of great significance and value for risk screening,early diagnosis and treatment of patients.Machine learning can explore new possibilities and reveal the hidden relationship in the big data of patient information statistics,which will have a positive impact on the auxiliary diagnosis and prognostic analysis of cardiovascular diseases.This paper expounds the commonly used risk scoring tools in clinic,and introduces the factors mainly dependent on patients physiological health indicators,past medical history and other factors,as well as the ability of Cox regression model to quickly screen high-risk factors.Review the application of different machine learning models,including random forest,support vector machine and neural network,in assessing the risk of patients with acute coronary syndrome,as well as the relevant characteristics and ability in predicting long-term and short-term adverse cardiovascular events.Finally,it looks forward to the broad prospect of the application of machine learning algorithm in medical data.Key Words:acute coronary syndrome;adverse cardiovascular events;machine learning;big data;auxiliary diagnosis0 引 言如今,计算机处理能力和硬件设备算力的大幅提升促进了信息技术在各个领域应用的发展,而这些进步也已渗透到心血管疾病诊断领域。作为人工智能的一个组成部分,机器学习在未来医学数据整合分析中将发挥重要作用1。机器学习相关算法可以处理大量临床数据,利用数据驱动为医生诊断提供参考。在电子病历数据或者影像学报告中适当地利用机器学习算法,可以降低成本、提高护理质量,并有助于对不良心血管事件的辅助诊断2。本文探讨机器学习相关算法如何提高对不良心血管事件的诊断与预后能力,以及其未来在改善急性冠脉综合征患者护理方面的潜力。传统统计学目前在临床试验与研究中收稿日期:2022-03-01基金项目:国家自然科学基金项目(81101116)作者简介:柯盼盼(1997-),男,上海理工大学光电信息与计算机工程学院硕士研究生,研究方向为深度学习、医学影像;陈胜(1976-),男,博士,上海理工大学光电信息与计算机工程学院副教授,研究方向为图像处理与分析、医学成像技术;李珂然(1996-),男,上海理工大学光电信息与计算机工程学院硕士研究生,研究方向为医学影像。本文通讯作者:陈胜。第 2 期柯盼盼,陈胜,李珂然:机器学习在不良心血管事件诊断中的应用综述发挥着至关重要的作用,然而如今新数据有多个来源,包括可穿戴设备、智能手机应用程序和电子病历等。随着数据在复杂性、量级和维度上的发展,将超过传统统计分析的阈值,而与之相反的是,由于数据驱动能力,机器算法的诊断性能会随着数据的增加而显著提高。不同于传统统计方法,机器学习模型除可揭示数据中隐藏的关系外,某些机器学习方法还可以独立进行操作,并提供关于数据性质的进一步洞察结果。1 临床风险预测模型1.1风险评估指标急性冠脉综合征(Acute Coronary Syndrome,ACS)患者属于高风险人群,包括急性心肌梗死和不稳定心绞痛3,其主要不良心血管事件涉及再梗、心衰、死亡、中风等4。临床中常用的风险评估工具是心肌梗死溶栓治疗临床试验(Thrombolysis in Myocardial Infarction,TIMI)评分和全球急性冠状动脉事件注册(Global Registry of Acute Cardiac Events,GRACE)评分5-6。TIMI风险评分主要涉及8个变量,包括年龄、动脉收缩压、心率、心功能Killip分级、体重、前壁心肌梗死、发病至治疗时间以及有无糖尿病、高血压或心绞痛病史,理论得分014分,该评分能够较好地预测患者14天全因死亡和心肌梗死的风险,以及30天和一年的全因死亡风险;GRACE风险评分指标包括年龄、心率、动脉收缩压、血肌酐、心电图显示ST段变化、Killip分级、入院时心脏骤停和心肌标志物升高,该评分基于研究制定,危险因素来自对住院死亡和出院后 6个月时死亡具有独立预测能力的因素。Anand等7使用GRACE风险评分对老年心梗患者一年的全因死亡风险进行预测,该评分结合临床衰弱量表,结果 AUC 为 0.86,并得到外部验证 AUC为0.75。这两种风险评分均可对急性心梗患者进行风险分层,同时也可用于评估并预测不同周期的相关死亡率。Chen等8使用两种风险评分对心肌梗死患者进行危险分层和长短期预后预测,其中GRACE评分在预测非ST段抬高型心梗患者的3年死亡率与ST抬高型心梗患者的1年和3年死亡率方面显著优于TIMI评分。这两个评分在预测亚洲心梗患者的短期和长期主要不良心脏事件方面显示出相当好的判别准确性。与简单TIMI风险评分相比,GRACE风险评分在预测长期死亡率方面更准确。Kao 等9使用GRACE和TIMI风险评分对急性心梗患者进行两年死亡率评估,其中GRACE评分AUC为0.74,略优于TIMI(0.73)。1.2Cox回归模型Cox回归模型通常被用来对患者进行风险评估与生存分析,通过患者的身体基线参数以及相关疾病指标因素,可以得到一个风险概率10。具体公式如式(1)、式(2)所示:h(t,X)=h0(t)exp(1X1+2X2+n)(1)h(t,X)=limt 0 P(t T t,X)t(2)其 中,h0(t)是 基 线 风 险 函 数,t是 生 存 时 间,X=(X1,Xn)是协变量,表示影响生存时间且不随时间变化的变量。=(1,2,n)表示其他给定变量不变时,对应X的系数变量11。若危险因素的变量不随时间变化,则h(t,X)/h0(t)不随时间变化,式(1)又被称为比例风险模型。风险概率公式(2)表示存活t时刻后,变量X在tt+t时间段内死亡概率与t之比的极限值。Cox回归模型在临床中用于危险变量分析,以及对患者进行风险评估。Leng等12通过Cox回归模型分析左心房应变因素与不良心血管事件之间的关联性,得到梗死面积风险比为1.01,左心房应变风险比为0.810.84,其应变因素和心梗面积可作为预后因素,通过左心房障碍和发病率预测心梗患者的死亡率。Tsai等13在Cox回归模型中加入新变量,如高血压、支架植入等,通过这些独立因素对冠心病患者的不良心血管事件进行预测,用于识别高危患者。2 基于机器学习的风险评估模型传统统计学方法使用选择性变量进行预测,无法汇总大数据,存在丢失重要信息的可能性,且只能对患者进行简单的风险评估,而机器学习模型可以从采集的大数据中提取关键变量进行预测,通过有效结合多数据来源,从数据中挖掘潜在关系,并进一步实现数据智能化,以提高医患管理效率。机器学习算法中包含的多种方法可以通过训练学习数据的有效表示,实现对不良心血管的风险评估14。相较于传统统计学方法对样本或总体的参数进行推断,机器学习侧重于实现数据结构算法,并进行回归预测或分类。大部分相关研究进行建模的数据一般是患者的电子病历、住院信息或是国家医疗信息库里的大批量数据,其中的变量涉及人口统计学、社会经济情况、病史、临床症状、生命体征和出院干预等15。数据汇总后通过特征工程处理,输入模型进行训练,具体流程如图1所示。人口统计学社会经济情况病史临床症状.大数据汇总特征工程决策树支持向量机随机森林梯度提升算法人工神经网络Fig.1Data processing flow图1数据处理流程 2132023 年软 件 导 刊2.1模型评价指标常见的模型评价指标包括准确率、特异度、灵敏度等,具体公式如式(3)-式(5)所示。Sensitivity=TPTP+FN(3)Specificity=FPFP+TN(4)ACC=TP+TNTP+FN+FP+TN(5)其中,TP表示实际与预测均为正,FP表示实际为负而预测为正,FN表示实际为正而预测为负,TN表示实际为负且预测为负。灵敏度表示实际类别为 1的样本中预测正确的比例,特异度表示实际类别为0的样本中预测错误的比例。为准确评估模型性能,