温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
因果
森林
医学
处理
效应
异质性
评价
中的
基本原理
应用
周文岳
方法学因果森林在医学处理效应异质性评价中的基本原理与应用周文岳1,易飞1,李冰丽2,孙凤3,杨智荣1,2,41.深圳理工大学计算机科学与控制工程学院(广东深圳 518055)2.中国科学院深圳先进技术研究院生物医学信息技术研究中心(广东深圳 518055)3.北京大学公共卫生学院流行病与卫生统计学系(北京 100191)4.剑桥大学临床医学院初级医疗中心(英国剑桥 CB1 8RN)【摘要】随机对照试验是评估干预措施效果的金标准,主要用于估计研究人群整体的平均干预效果。但同一种干预对不同特征人群的效果可能存在显著差异,即存在处理效应异质性。传统的亚组分析和交互作用分析对处理效应异质性的检验功效通常较低,难以有效发现异质性来源。近年来,随着机器学习技术的发展,因果森林成为评估处理效应异质性的新方法,可有效解决传统分析的局限性。然而,该方法在医学研究领域的应用尚处于起步阶段。为促进该方法的合理使用,本文在医学干预效果评价的情境下,介绍因果森林方法的用途、基本原理和实现步骤,并结合实例解读及代码实现样例,讨论使用因果森林方法的注意事项。【关键词】因果森林;处理效应;异质性;原理;应用Causal forest in the evaluation of heterogeneity of treatment effects in medicine:basicprinciples and applicationZHOU Wenyue1,YI Fei1,LI Bingli2,SUN Feng3,YANG Zhirong1,2,41.Faculty of Computer Science and Control Engineering,Shenzhen Institute of Advanced Technology,Chinese Academy of Sciences,Shenzhen 518055,P.R.China2.Research Center for Biomedical Information Technology,Shenzhen Institute of Advanced Technology,Chinese Academy of Sciences,Shenzhen 518055,P.R.China3.Department of Epidemiology and Biostatistics,School of Public Health,Peking University,Beijing 100191,P.R.China4.Primary Care Unit,School of Clinical Medicine,University of Cambridge,Cambridge CB1 8RN,United KingdomCorresponding author:YANG Zhirong,Email:;zy266medschl.cam.ac.uk【Abstract】Randomized controlled trials are the gold standard for evaluating the effects of medical interventions,primarily providing estimates of the average effect of an intervention in the overall study population.However,there maybe significant differences in the effect of the same intervention across sub-populations with different characteristics,that is,treatment heterogeneity.Traditional subgroup analysis and interaction analysis tend to have low power to examinetreatment heterogeneity or identify the sources of heterogeneity.With the recent development of machine learningtechniques,causal forest has been proposed as a novel method to evaluate treatment heterogeneity,which can helpovercome the limitations of the traditional methods.However,the application of causal forest in the evaluation oftreatment heterogeneity in medicine is still in the beginning stage.In order to promote proper use of causal forest,thispaper introduces its purposes,principles and implementation,interprets the examples and R codes,and highlights someattentions needed for practice.【Key words】Causal forest;Treatment effect;Heterogeneity;Principles;ApplicationDOI:10.7507/1672-2531.202212074基金项目:国家自然科学基金项目(编号:72274193);深圳市科技计划资助项目(编号:JCYJ20220530154409021、KQTD20190929172835662);先进院优秀青年创新基金项目(编号:E2G011)通信作者:杨智荣,Email:;zy266medschl.cam.ac.uk中国循证医学杂志 2023年4月第23卷第4期 485 http:/ 1 前言随机对照试验是评估干预效果的金标准,主要用于估计干预在研究人群整体中的平均效果,但试验平均效果不一定适用于每一个体,同种干预对于不同特征人群的效果可能存在显著差异,即存在处理效应异质性。如何针对处理效应异质性进行评价是推动精准医学计划、促进个体化医疗的关键。为确定处理效应异质性的来源,研究者通常根据不同人群特征分组(一般根据预定的假设)进行亚组分析,或在回归分析的传统模型中加入人群特征与干预措施的交互项并检验其统计学显著性。然而,每一次亚组分析通常只根据一种人群特征进行分组,若同时有多个亚组分析,可能会增加假阳性的机会1,2。但当多种人群特征同时叠加才会影响干预效果时,则按单个特征分组的亚组分析难以奏效3。而在对交互项的分析中,当需要同时叠加多种人群特征时,交互项个数会呈指数增加,研究者手动设置这些交互项是非常费时费力的4。此外,相比平均效应的估计,不管是亚组分析还是交互项检验都需要更大样本量的数据支持,否则难以保证足够的检验效能5。为克服上述传统方法的局限性,因果森林(causal forest)作为一种新兴技术开始应用于评估处理效应异质性。该方法不需要预先设定异质性来源,而是通过机器学习,帮助研究者找出传统因果分析中被掩盖的异质性。该算法由 Atheya(2021 年诺贝尔经济学奖得主)等6于 2016 年在决策树的基础上提出,首次将分类回归树引入到因果识别框架,形成因果树。2018 年 Wager 等7进一步探讨了如何使用生成的因果树执行随机森林的算法,即因果森林。该方法在 2019 年首次引进国内8。本文将进一步介绍因果树和因果森林的算法、实例解读和软件实现,探讨因果森林在医学干预措施的效应异质性评价中的应用。2 基本原理2.1 因果树因果树是在决策树的基础上发展而来的机器学习方法。决策树以信息增益、信息增益比、基尼系数或误差平方和等指标作为分裂准则,将样本层层分组9。为避免单一一棵决策树过拟合的情况,可通过随机选取变量和样本的方式来生成许多不同的决策树,形成随机森林,然后由每一棵树进行“投票”来决定最后的分组10。(x)与决策树不同,因果树按照某特征分组后将组间处理效应值之差最大作为分裂准则,分别估算出各组的处理效应。此时组内个体的平均处理效应就是该组个体处理效应的预测值。根据因果推断的“反事实”原理,按特征 X 分组后的平均处理效应值可以用如下等式来表示:(x)=EYi(1)-Yi(0)|Xi=x(公(公式式 1:个体平均处理效应值):个体平均处理效应值)(x)公式 1 假设个体 i 能够接受两种干预,其中Xi=x 代表某个人群特征 x,Yi(1)表示个体 i 接受干预的结局,Yi(0)表示个体 i 不接受干预(或接受其他干预)的结局。即按照某个特征分组后,分别计算各组的差值,再找出分组后各组差值最大的特征 x 作为分裂的节点。由于实际情况下只能获得到个体 i 的观测结局 Yi(1)或 Yi(0),而无法同时获得两者。因此在随机对照试验的背景下,我们一般用人群的平均处理效应(即 EY(1)和 EY(0))来代替个体的处理效应,进而衡量两组人群结局间差异:=EY(1)-Y(0)(公(公式式 2:人群分组平均处理效应值):人群分组平均处理效应值)根据公式 2,在构建因果树时算法自动找出当前人群按某个特征值分成两组后的组间处理效应值之差最大(分裂准则),并按此特征值分组;然后在各组中重复上述步骤,直到生成符合预设要求的因果树。2.2 因果森林与随机森林相比,因果森林在节点分叉、模型拟合和处理效应估计三个方面都有自己的特点6。对于决策树-随机森林模型,我们可以用验证集对其进行验证,使用如均方误差之类的指标来度量预测的准确性。但在因果树-因果森林模型中,由于无法观察到真正的处理效应,因而无法实现如决策树-随机森林模型那样的验证。为此,需要通过检查偏差、标准误差和相关估计的可信区间来评估因果森林的准确性。为实现这种统计推断,Atheya 和Wager 两人引入了诚实(honesty)算法7。(x)(x)(x)诚实算法要求树的分裂和的估计分开进行,即每次从训练集中随机抽取一定比例的样本用于构建单个树模型,将抽样后的样本分为两部分,一部分用于估计树模型参数(分裂子样本),另一部分用于计算节点内部的处理效应(估计子样本),这样做可以减少对的估计误差。估计子样本填充在分裂子样本拟合的树中,根据末端叶子 486 CHINESE JOURNAL OF EVIDENCE-BASED MEDICINE,Apr.2023,Vol.23,No.4 http:/节点中估计子样本的 EY(1)和 EY(0)之间的差异来对处理效应做预测。在构建完森林模型后,根据特征变量在森林的每个层次上进行分裂的次数,计算每个特征变量的重要性并根据重要性排序。最后,基于因果森林中的最优树模型,在验证集中采用传统因果分析方法对不同亚组的处理效应进行估计。因果森林实现步骤如下:随机抽样:将原始数据集随机分成训练集和验证集,然后无放回地再从训练集里随机抽取样本(一般比例为 50%,可根据原始样本量进行调整)作为分裂子样本,将剩下部分作为估计子样本。由于训练集(包括分裂子样本和估计子样本)和验证集是随机抽样形成的,理论上均可代表研究的源人群。生成因果树和因果森林:先用分裂子样本的数据,以特征变量 X 基于递归分区的方式构造因果树模型,即从根节点开始自顶向下对样本进行划分。利用以下公式计算估计子样本每个叶子节点上所有个体的平均处理效应值,即:i(x)=1|i:Wi=1,Xi L|i:Wi=1,XiL|Yi-1|i:Wi=0,Xi L|i:Wi=0,XiL|Yi(i E)(公(公式式 3:平均处理效应估计值):平均处理效应