温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
282
29
检验
Meta
分析
异质性
评价
中的
误用
数理医药学杂志 2023 年 8 月第 36 卷第 8 期 J.Math.Med.Aug.2023,Vol.36,No.8561https:/ 申,谢雨霖,曹世义华中科技大学同济医学院公共卫生学院(武汉430030)【摘要】Meta 分析异质性是指 Meta 分析纳入的各单项原始研究间存在的差异。选用恰当的方法或指标识别和测量异质性是评价 Meta 分析结果可靠性的重要步骤。尽管 I2检验是目前使用极为广泛的 Meta 分析异质性检验方法,但从 I2统计量定义可知,I2检验并不能真实展现异质性大小,当前 Meta 分析异质性评价方法误用情况严重。本研究系统梳理 Meta 分析常用异质性评价方法,通过两个实例展示 I2统计量在 Meta 分析异质性检验中的误用情况,并介绍能够合理展现 Meta 分析异质性的统计指标,以期提高 Meta 分析异质性评价的可靠性和规范性。【关键词】Meta 分析;I2检验;I2统计量;异质性The misuse of the I2 test in the evaluation of heterogeneity of Meta-analysisShi-Qi WANG,Qing-Qing JIANG,Shen HUANG,Yu-Lin XIE,Shi-Yi CAOSchool of Public Health,Tongji Medical College,Huazhong University of Science and Technology,Wuhan 430030,ChinaCorresponding author:Shi-Yi CAO,Email:【Abstract】The heterogeneity of Meta-analysis refers to the differences among the individual studies included in the Meta-analysis.Selecting appropriate methods to identify and measure heterogeneity is an important step to evaluate the reliability of Meta-analysis results.The I-squared(I2)test is the commonly used heterogeneity test of Meta-analysis,but according to the definition of I2 statistic,I2 test cannot truly show the heterogeneity,and the current evaluation methods of heterogeneity of Meta-analysis are seriously misused.This study aimed to systematically review the commonly used heterogeneity evaluation methods of Meta-analysis,introduce the misuse of I2 statistic in the test of heterogeneity of Meta-analysis through two examples,and propose statistical indicators that can truly show the heterogeneity of Meta-analysis,in order to provide reference for improving the reliability and normativity of Meta-analysis researches.【Keywords】Meta-analysis;I2 test;I2 statistic;Heterogeneity在 Meta 分析中,异质性是指纳入的单项研究间存在的差异,包括由受试者、干预措施和结局指标等差异引起的临床异质性,由研究设计和偏倚引起的方法学异质性,以及统计学异质性1。如果异质性较大,Meta 合并结果的可靠性就会大大降低,甚至在异质性过大时应当放弃 Meta 分析而仅进行系统性综述。因此,在进行Meta分析时,选用恰当的异质性评价手段来识别和测量异质性至关重要。常用的 Meta 分析异质性检验方法以 Q 检验数理医药学杂志 2023 年 8 月第 36 卷第 8 期 J.Math.Med.Aug.2023,Vol.36,No.8562https:/ H 检验和 I2检验。近年来发表的 Meta 分析研究中,研究者常用 I2取值来划定研究的异质性程度,以 25%、50%和75%区分为低、中、高度异质性,当 I2 50%时认为存在明显异质性,采用随机效应模型,I2 50%时则采用固定效应模型。然而,这种方式并不符合 I2统计量的定义,也无法真实地展示研究异质性大小2-3。本文梳理了目前常用的Meta 分析异质性评价方法,解读 I2统计量误用情况,并介绍能够反映Meta分析异质性的统计指标。1 Meta分析常用的异质性评价方法Cochrane 手册认为,纳入同一个 Meta 分析的所有研究都不可避免地存在差异,假如一项 Meta分析中得出的合并效应量为 1.2,其纳入的单项研究效应量分布在 1.1 到 1.3 之间或 0.5 到 1.9 之间,两者的临床价值将大不相同,因此任何 Meta分析都必须进行异质性评价,常用异质性评价方法有图示法和统计学检验两类。1.1 图示法图示法以森林图为主,可显示每项研究及合并效应量的置信区间,如果各单项研究的置信区间很少发生重叠或几乎不重叠,则提示 Meta 合并结果的异质性较大。除森林图外,拉贝图、Galbraith 星状图、漏斗图等也可应用于异质性评价,代表各单项研究的点偏离代表合并效应量的线条越远则提示该研究造成 Meta 分析异质性的可能性越大。图示法可以简单直观地体现各单项研究偏离合并值的情况,但是存在明显局限性,其主观解读空间较大,且无法定量估计异质性大小,所以在实际研究中往往采用统计学检验来定量评估Meta 分析的异质性。1.2 统计检验法常用的 Meta 分析异质性统计学指标有 Q 统计量、I2统计量、H 统计量等4。Q 统计量是标准化尺度上所有单项研究关于平均效应量的离差平方和,展示 Meta 分析可观察到的所有差异,其计算公式如下5:Xi为第 i 项研究的效应量,M 为固定效应加权的平均效应量,为第 i 项研究的标准误。Q统计量服从自由度为k-1的卡方分布,当P0.05时可认为研究间的差异由抽样误差引起,即 Meta分析不存在显著异质性,反之,则说明研究间差异无法完全由抽样误差解释,则必须考虑 Meta 分析的异质性。Q 统计量在异质性检验中应用非常广泛,但容易受到纳入研究数量的影响,如果纳入研究较多,Q 检验易出现假阳性,如果纳入研究较少,易出现假阴性。H 和 I2统计量在 Q 统计量的基础上,通过校正自由度来降低研究数量对异质性检验结果的影响,相对稳定可靠,其计算公式如下:df 为自由度,I2统计量的分子反映了除去抽样误差以外各研究间的离差平方和,故 I2统计量反映了研究间异质性在合并效应量总差异中所占的比例5。当 Q df 时,I2取值为 0,故 I2的取值范围在 0%100%之间。需要注意的是,I2和H 统计量只能反映研究间异质性和总差异之间的关系,而不能用来直接判断Meta分析异质性大小。2 I2统计量在Meta分析异质性评价中的误用在部分 Meta 分析中,研究者用 I2统计量简单地描述异质性大小,以 I2 取 25%、50%和 75%这三个值来分别划定低、中、高水平的异质性,但 I2统计量与异质性大小并无直接对应关系,简单使用 I2统计量表达异质性可能会存在 I2很大而实际异质性较小,或 I2很小而实际异质性较大的谬误。本文将通过两个 Meta 分析实例来展示这一误用。2.1 I2较大而实际异质性较小的研究实例在一项关于非工作时间入院对急性缺血性脑卒中患者死亡率影响的 Meta 分析中,与工作时间入院相比,非工作时间入院的急性缺血性脑卒中患者发生院内死亡的比值比为 1.08,95%置信区间为(1.03,1.12),I2统计量为 69%6。按照目前常用的 Meta 分析结果解释方式,该研究提示非工作时间入院可以显著增加急性缺血性脑卒中患者的院内死亡风险,但效应量异质性较大。然而该 Meta 分析的单项研究效应值分布情况如图 1-A所示,研究间实际离散程度较小。?=?=1?2?=?2=?100%数理医药学杂志 2023 年 8 月第 36 卷第 8 期 J.Math.Med.Aug.2023,Vol.36,No.8563https:/ I2较小而实际异质性较大的研究实例在一项关于膳食中摄入-亚麻酸对心血管死亡风险影响的 Meta 分析中,与摄入少量-亚麻酸的人群相比,摄入大量-亚麻酸者死于心血管疾病的比值比为 0.89,95%置信区间为(0.81,0.97),I2统计量为 5.6%7。按照目前常用的 Meta 分析结果解释方式,该研究提示膳食中摄入大量-亚麻酸是心血管疾病的保护因素,且研究异质性极小。然而该 Meta 分析的单项研究效应值分布情况如图 1-B 所示,研究间实际离散程度较大。图1两项Meta分析实例中纳入研究效应值的分布情况Figure1.DistributionoftheeffectsizesofincludedstudiesinthetwoMeta-analysisexamples注:A.该研究的效应量及95%置信区间为1.08(1.03,1.12),95%预测区间为(0.96,1.21);B.该研究的效应量及95%置信区间为0.89(0.81,0.97),95%预测区间为(0.74,1.07)。2.3 I2统计量的解读上述两个实例中,实例 1 的 I2明显大于实例2,但后者的研究间实际离散程度却更大,说明 I2统计量并不能直接判断研究异质性大小。在 Meta 分析中,需要区分观察到的效应量和真实的效应量。观察到的效应量是对总体人群效应量的估计,但由于抽样误差,观察到的效应量总是与该人群中的真实效应量不同,其方差比真实方差更大。如果每个单项研究的效应值完全相等,那么观察到效应量的预期方差(VOBS)将等于各单项研究的误差方差(VERR),即:?=?当每个单项研究的效应值不相等时,这个等式将引入真实效应的方差(T2),即:根据 I2统计量的定义,I2计算公式可以改写为:I2统计量反映了研究间异质性在合并效应量总差异中所占的比例,故实例 1 中的 I2为 69%仅表明观察到的差异有 69%是由异质性而非抽样误差引起,实例 2 中 I2为 5.6%仅表明观察到的差异有 5.6%是由异质性而非抽样误差引起。对于较小的总差异来说,较大的 I2依旧会得出较小的异质性,而相应地,对于较大的总差异来说,较小的 I2依旧会得出较大的异质性。3真实展现Meta分析异质性的统计指标总体效应量的 95%置信区间反映的是总体效应估计值的精确程度,即样本总体的平均水平会落在这个范围内,而不是样本中 95%的个别值会落在这个范围内。当研究者应用 Meta 分析为临床实践提供指导时,希望结果能够适用于绝大部分患者,此时更需要总体效应值的预测区间。预测区间是均值两侧两个标准差的范围,如果样本符合正态分布假设,则可以预期总体内95%的个体真实效应将落在这个区间内。预测区间直观而清晰地提供了关于绝对离散程度的信息,在 Meta 分析当中应当汇报预测区间来体现研究结果的异质性8。在实例 1 中,汇报研究异质性时不应只汇报I2=69%,而应表明绝大多数非工作时间入院的急性缺血性脑卒中患者的院内死亡风险将落在 0.96到 1.21 之间