分享
基于机器学习和术前资料构建肝癌切除术中出血预测模型_郑咏坤.pdf
下载文档

ID:2253291

大小:498.04KB

页数:9页

格式:PDF

时间:2023-05-04

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 机器 学习 资料 构建 肝癌 切除 出血 预测 模型 郑咏坤
第 卷第期 年 月福建医科大学学报 基于机器学习和术前资料构建肝癌切除术中出血预测模型郑咏坤,吴春香,姚志雄摘要:目的探索借助机器学习算法利用术前资料构建肝癌切除术中出血预测模型的可行性和应用价值。方法回顾性分析 例原发性肝癌手术患者的临床资料,按比例随机筛选出训练集 例和测试集 例。模型 采用基于实际手术时间的随机森林()模型建立,模型采用基于混合密度网络()模型的预测手术时间联合 模型建立。二分类结局的单因素回归分析采用 回归模型。连续型结局变量筛选采用 回归模型,模型预测精度采用均方根误差()、平均绝对百分比误差()等衡量;分类变量预测模型预测性能采用准确率、校准曲线、评分、工作曲线下面积()等衡量;模型性能稳定性采用全部样本的 法验证。结果()训练集“切除肝段数”项与验证集临床资料比较,差别有统计学意义(),其他项目差别无统计学意义。()手 术 时 间 预测模 型 训 练 集、验 证 集 与 真 实 值 差 别 的 、分别为(,)和(,)。()虽然训练集及内部验证中模型较模型有更高的预测准确率(),更低的 评分(),更好的预测性能(:),但模型仍拥有较好的准确性及预测性能;在验证集中模型与模型有一致的准确率()、评分(),差别无统计学意义(,)。模型 与模型 在训练集、验证集及内部验证的预测结果有中高度的一致性(为 )。结果显示模型、表现稳定。结论利用术前资料联合、算法有助于构建良好性能的肝癌切除术中出血预测模型,但需要多中心大样本数据进一步验证。关键词:肝癌;肝切除术;手术时间;术中出血;预测;机器学习文献标志码:文章编号:()收稿日期:作者单位:福建医科大学 孟超肝胆医院麻醉科,福州 ;中国人民解放军联勤保障部队第 医院 感染科,福州 作者简介:郑咏坤,男,住院医师,医学硕士通信作者:姚志雄 :中国肝癌发病率高。据国家癌症中心统计,中国人群肝癌粗发病率 年为 万,预测未来 中国人群肝癌每年发病人数和死亡人数将超过 万。手术切除仍是治疗原发性肝癌的主要手段。年,等报道,仍有约 的肝切除术中出血 。肝切除术前、后需要输注红细胞的患者占比。肝切除术中大出血和输血可能增加术后并发症的发生,且可能增加癌症复发的风险,进而降低总体生存率。术中大出血风险因素包括手术时间、肿瘤特征(类型、大小、位置、是否存在血管受累)、肝切除范围、伴随的肝外器官切除等。世纪人工智能飞速发展,在肝癌的治疗决策、术前评估、精准手术切除、术后管理、指导辅助治疗等方面应用越来越广泛。随机森林算法(,)与线性建模方法相比,预测性能相当或更佳,已广泛应用于基因 筛 选、疾 病 诊 断、预 后 疗 效 等 医 学 相 关 领域,。如果能利用患者术前资料及 算法在肝癌术前进行术中出血预测,可能有助于更好地进行围术期血资源调配、手术风险把控及术后并发症管理。肝癌切除手术时间作为重要的模型预测因子之一,同样能利用混合密度网络模型(,),根据术前资料进行相当精确的预测。联合、算法构建模型,使得基于术前资料预测术中出血成为可能,有望以更准确、全面、具体的方式对肝癌手术进行风险评估。本研究回顾性分析福建医科大学孟超肝胆医院(笔者医院)年月 年 月 例原发性肝癌手术患者的临床资料,探讨基于 、算法,利用患者术前资料构建肝癌切除出血预测模型的可行性及其应用价值。对象与方法 对象 例中,男性 例,女性 例;年龄(岁)()岁。纳入标准:()年龄 周岁;()病理确诊为原发性肝癌,行肝癌切除术的患者;()术中可联合“黏连松解术”或者“胆囊切除术”。排除标准:()年龄 周岁、孕妇、免疫缺陷病毒携带者、肺结核活动期患者;()有类风湿关节炎、系统性红斑狼疮等全身免疫性疾病史的患者;()甲状腺功能亢进、甲状腺功能减退未得到纠正的患者;()严重系统性疾病如慢性心力衰竭、慢性阻塞性肺疾病、严重肺动脉高压、肾衰竭等患者;()阿第期郑咏坤,等:基于机器学习和术前资料构建肝癌切除术中出血预测模型司匹林、华法林等抗血小板、抗凝药物服用史,长期激素服用史的患者;()转移性肝癌患者或“肝癌切除术”前进行了经肝动脉化疗栓塞术、放化疗、免疫治疗的患者;()二次肝胆手术的患者;()既往其他部位肿瘤放化疗、免疫治疗史患者;()血液疾病患者;()术前已经出现肝癌破裂出血的患者;()联合“纳入标准()”之外的手术内容的患者。本研究通过笔者医院医学伦理委员会审批(审批号科审 );伦理同时批准全部患者免签知情同意书。分组出血量通过吸引器量筒和湿纱布称重法量化计算总出量,减去冲洗液量得出。纳入的患者分为出血 组和出血 组。机器学习构建预测模型 例患者通过计算机产生随机数按比例随机筛选出训练集和测试集。其中训练集 例,测试集 例,采用单因素 回 归 分 析 筛 选 指 标,利 用 、库 构 建 模 型;采 用 库 模块进行回归分析筛选指标,利用 库、构建 模型。使用训练集进行训练,运用折交叉验证,就最大深度、最小分裂样本数、子分类器数目等参数进行网格搜索,以预测准确率为优化目标,采用可重复采样的形式及特征分裂技术等形成多棵分类树,投票获得最佳模型。对训练集连续型数据进行标准化和归一化,对无序分类数据进行独热编码(,一种虚拟变量设置方法);使用 库 模块对数据进行聚类,获得所需正态模型混合元数目;根据特征变量数自动设置输入层神经元数目,激活函数为“”;设置 层全连接隐含层,激活函数为“”;输出层设置个神经元,分别独立训练并输出个平均数、个标准差、个混合概率;输出层除混合概率激活函数为“”外,其余输出层不设激活函数(图);为防止过拟合,训练过程中引入早停止()技术,及时停止未能有效减少平均方差的后续训练过程。:多层感知器;:平均值;:标准差;:混合概率;:修正线性单元;:改良修正线性单元;:柔性最大传递函数;:混合密度网络。图 模型训练过程 观察指标和评价标准()临床资料。包括出血量、手术时间、性别、年龄、体质量指数(,)、腹腔手术史、术式、肝硬化、共存疾病、切除肝段数、术中阻断、甲胎蛋白(,)、血小板计数(,)、总胆红素(,)、丙氨酸氨基转移酶(,)、天门冬氨酸氨基转移酶(,)、白蛋白(,)、凝血酶原(,)延长时间、肌酐(,)、纤维蛋白原、最大肿瘤直径、增强扫描肿瘤边界及与血管关系等项目。()模型预测精确度分析。()联合 、的预测模型与应用真实手术时间数据(本研究指从切皮开始至缝皮结束经历的时间)的 预测模型的精确度及预测性能比较。模型比较参数采用均方根误差(,)、平均绝对百分比误差(,)评价预测的连续型变量值与真实值差别,采用准确率、评分、校准图评价预测的分类变量值与真实值符合情况;采用 值比较模型间分类变量预测结果是否一致;采 用 受 试 者 工 作 曲 线(,)及曲线下面积(,)比较不同模型间的预测性能;采用全部样本的 次 采样技术内部验证模型性能稳定性,包括准确率、评分、福建医科大学学报 年 值等指标平均值及 可信区间。统计学处理采用 软件进行统计分析。近似正态分布的计量资料以表示,组间比较采用检验。计数资料采用绝对数或率表示,组间比较采用检验。分类变量回归分析采用 回归模型。模型间分类变量预测结果一致性比较采用 一致性分析。模型间 比较采用 检验。为差别有统计学意义。结果 临床资料分析训练集和测试集患者除“切除肝段数”项目有差别外(),在出血量、手术时间、性别、年龄、腹腔手术史、术式、肝硬化、共存疾病、术中阻断情况、术前 、延长时间、纤维蛋白原及最大肿瘤直径、增强扫描肿瘤边界及与血管关系等项目比较,差别均无统计学意义(,表)。表训练集和测试集临床基本资料分析 因素训练集测试集统计值分组 性别 男 女 年龄岁 腹腔手术史 无 有 手术 肝硬化 是 否 术式 腔镜 中转开腹 开腹 最大肿瘤 共存疾病 无 心血管病 糖尿病 两者均有 表(续)因素训练集测试集统计值术中阻断 无 有 肿瘤边缘清晰、与血管关系不密切 是 否 切除肝段数个 ()()()延长 纤维蛋白原()()()():体质量指数;:甲胎蛋白;:血小板;:白蛋白;:总胆红素;:凝血酶原;:肌酐;:丙氨酸氨基转移酶;:天门冬氨酸氨基转移酶。表中年龄、手术时间、最大肿瘤直径、延长时间、纤维蛋白原、数据为,余为。机器学习模型的变量筛选及模型构建 利用真实手术时间数据构建肝癌出血预测模型训练集出血 者 例,者 例。单因素 回归分析结果显示,不考虑交互作用前提下,手术时间、性别、术式、切除肝段数、术中阻断情况、最大肿瘤直径、纤维蛋白原、肿瘤边界及与血管关系、是影响出血量的相关因素(表)。将以上个变量数据纳入 模型进行训练得到模型。手术时间预测模型构建及精确度分析训练集连续型数据进行标准化及归一化、无序多分类第期郑咏坤,等:基于机器学习和术前资料构建肝癌切除术中出血预测模型数据进行多个二分类设置后进行 折交叉验证 回归,得出平均方差最小、纳入变量数目最佳对应的 正则化系数值为 (图),筛选出的变量为性别、腹腔术史、肝硬化诊断、术中阻断情况、延长时间、术式、共存疾病、切除肝段数、最大肿瘤直径、纤维蛋白原、增强扫描肿瘤边界及与血管关系(其中 、为分类变量,赋值同表)。将以上 个变量纳入 模型进行训练,最终模型在训练集中预测值与真实值差别的 为 ,为 ;验证集预测值与真实值差别的 为 ,为 。采用 模型预测的平均手术时间值作为模型 的“手术时间”变量值参与预测记为模型。表训练集出血 单因素 回归分析 临床因素赋值出血 手术时间 性别 男 女 年龄 体质量指数 腹腔术史 是 否 术式腔镜 中转开腹 开腹 肝硬化 是 否 共存疾病无 心血管病 糖尿病 两者均有 术中阻断 否 是 ()()()福建医科大学学报 年表(续表)临床因素赋值出血 ()()延长 纤维蛋白原 最大肿瘤直径 肿瘤边界及与血管关系 边界不清晰或关系密切 边界清晰且关系不密切 切除肝段数目 :体质量指数;:甲胎蛋白;:血小板;:白蛋白;:总胆红素;:凝血酶原;:肌酐;:丙氨酸氨基转移酶;:天门冬氨酸氨基转移酶。为连续变量,出血量 患者的手术时间、年龄、纤维蛋白原、最大肿瘤直径分别为()、()岁、()、()、()和()。图 回归确定最佳 正则化系数 模型 与模型 预测精度及预测性能比较、性能稳定性验证训练集中,模型 的预测准确率为 ,而模型的准确率为 ;校准图显示模型、均较稳健(图),评分()优于()(表);模型的预测性能()优于模型()(图),且差别有统计学意义(检验 ,表)。验证集中,模型 与模型均有 的预测准确率,两模型的稳健性及 评分方面相当()(图),预测性能(:,图)差别无统计学意义(检验 ,表)。无论在训练集还是在验证集,两模型有中度甚至高度以上预测一致性(表)。采用 次 法内部验证模型 及模型的性能稳定性(表)。结果显示,模型 无论在 ()、评分()还是准确率()均优于模型,两模型仍有中高度以上预测一致性()。模型 (,),(,),准 确 率(,)及 模 型 (,),(,),准 确 率(,)各指标在内部 验证中表现较稳定(表)。第期郑咏坤,等:基于机器学习和术前资料构建肝癌切除术中出血预测模型表模型间预测精度及一致性比较 模型训练集准确率 评分 值验证集准确率 评分 值模型 模型 讨论原发性肝癌包括肝细胞癌、肝内胆管细胞癌及混合癌。肝细胞癌是亚洲和非洲的主要原发性肝癌种类,男性高发,近年来其发病率与死亡率均升高;研究 报道,近年来肝内胆管细胞癌的发病率、致死率也有所上升。手术切除是治疗原发性肝癌的重要手段,也是治愈肝癌的重要途径。随着快速康复表模型间预测性能比较 模型训练集 验证集 模型 模型 :曲线下面积。图模型在训练集(左)和验证集(右)的校准图 ()()():受试者工作曲线;:曲线下面积。图模型在训练集(左)和验证集(右)的 曲线 ()()()福建医科大学学报 年表模型性能 验证 指标模型平均值 模型平均值 评分 准确率 值 :曲线下面积。外科的推广普及,腹腔镜手术成为肝癌首次切除术的主流手术方式。荟萃分析证实,在复发性肝癌的二次肝癌切除术中,腹腔镜在减少术中出血、术后并发症、缩 短

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开