分享
倾向性评分匹配法在疫苗保护效果评价中的应用_黄澳迪.pdf
下载文档

ID:2326208

大小:236.83KB

页数:5页

格式:PDF

时间:2023-05-07

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
倾向性 评分 匹配 疫苗 保护 效果 评价 中的 应用 黄澳迪
倾向性评分匹配法在疫苗保护效果评价中的应用黄澳迪,唐林,李平,尹遵栋,王富珍(中国疾病预防控制中心免疫规划中心,北京 100050)DOI:10.19914/j.CJVI.2023020基金项目:中国 CDC 公共卫生应急反应机制的运行(131031001000150001)通信作者:王富珍,Email:wangfz chinacdccn第一作者 Email:huangad chinacdccn摘要:疫苗保护效果(Vaccine effectiveness,VE)评价是疫苗上市后真实世界研究的重要内容。真实世界 VE 评价中使用倾向性评分匹配法(Propensity score matching,PSM)可以克服在研究设计阶段难以随机化的缺点,有效降低研究中可测量的混杂偏倚,使结果更加可信。本文对 PSM 的原理、方法、优缺点以及在 VE 评价中的应用进行了综述,为真实世界 VE 评价中使用 PSM 提供方法学参考。关键词:疫苗;保护效果;真实世界研究;倾向性评分匹配中图分类号:331;186文献标识码:A文章编号:1006916X(2023)01011905Application of propensity score matching for evaluating vaccine effectivenessHuang Aodi,TangLin,Li Ping,Yin Zundong,Wang Fuzhen(National Immunization Program,Chinese Center for DiseaseControl and Prevention,Beijing 100050,China)Abstract:Vaccine effectiveness(VE)evaluation is an important part of post-marketing,real-worldstudy of vaccines as they are used Propensity score matching(PSM),used in the evaluation of real-world VE,can overcome difficulties with randomization at the study design stage,reduce confoundingbiases,and produce reliable result In this article,we describe principles,methods,and advantagesand disadvantages of PSM and the application of PSM in VE evaluation We aim to provide amethodological reference for real-world VE evaluation using PSMKey words:Vaccine;Vaccine effectiveness;eal-world study;Propensity score matching疫苗保护效果(Vaccine effectiveness,VE)评价是疫苗上市后真实世界研究的重要内容1,最常用到的 VE 评价方法为队列研究和病例对照研究,其基本思路是分别计算疫苗接种组和对照组发病率,从而计算得到 VE,但是选择研究对象难以避免选择偏倚2。倾向性评分(Propensity score,PS)可以控制研究中测量变量的混杂,平衡研究对象之间的差异。通过匹配、分层3、逆概率加权4、协变量调整等方法来调整可测量的混杂因素5,提高组间的可比性。在 PS 方法中,倾向性评分匹配法(Propensityscore matching,PSM)常用于评价某一疗法或者药物的临床效果6,但在 VE 评价中应用较少。本文介绍了 PSM 的原理、分类、优缺点及其在 VE 评价中的应用场景,为 VE 评价方法的选择提供参考。1PSM 的定义和基本原理PS 最初由 osenbaum 和 ubin 于 1983 年提出,被定义为在给定观察到的协变量向量的情况下,研究对象被分配给特定治疗的条件概率7。PSM的基本原理是,在给定的一组可观察的协变量(Xi)的条件下,研究对象 i(i=1、2、3、n)被分配到处理组(Zi=1)或者对照组(Zi=0)的条件概率,这一条件概率可以表示为 e(xi)=pr(zi=1|Xi=xi),其中 xi是个体 i 的协变量,e(xi)是个体 i 被分入处理组的概率8,即 PS。PS 通常使用 Logistic 回归进行估计5,还可以通过随机森林9、神经网络10 等方法进行估计。PSM 是将处理组和对照组中具有相似 PS 的个体进行匹配,使处理组和对照组的混杂因素分布处911中国疫苗和免疫 2023 年 2 月第 29 卷第 1 期于平衡,从而最大限度减小这些可测量的混杂因素对结局的影响,并且具有相似 PS 的组内结局也可以对处理因素的效果进行无偏倚估计11。PSM 还可以规避标准多变量回归建模的一些局限性12。2PSM 常用的匹配方法2.1最近邻匹配(Nearest-neighbor matching)最近邻匹配依赖于贪婪算法,也称为贪婪匹配(Greedymatching)13。该方法首先通过已观测到的协变量来计算对照组和处理组研究对象的 PS,在处理组中随机选择一个研究个体,在对照组中选择一个 PS与已选择的处理组个体最接近的对象作为匹配对象,然后重复此过程,直至处理组中的所有个体均在对照组中完成匹配或者对照组中个体全部使用完毕14。最常采用 11匹配,当对照组包含有更多的个体时,也可以采用 1:n 匹配15。2.2卡钳匹配(Caliper matching)卡钳匹配是在最近邻匹配的基础上设定一个卡钳值,只有当对照组和处理组个体的 PS 绝对差值小于设定的卡钳值时,匹配才会成功16。更小的卡钳值将形成更相似的匹配对,使两组协变量更加平衡,但匹配数量可能会大大减少,因此在使用该方法时可能需要试验不同的卡钳来优化匹配。研究表明,使用卡钳值为 PS对数标准偏差的 0.2 可以消除 98%的由于测量协变量引起的偏差17。蒙特卡洛模拟表明,卡钳匹配与最近邻匹配相比,估计的偏差更小,使用均方误差进行评估时的估计值表现最佳18。2.3半径匹配(adius matching)半径匹配是预先设定一个范围,即半径,处理组中的每一个体与在该个体 PS 半径内相应的对照组个体进行匹配19。这种方法的优点是,它仅使用预定范围内的对照组个体进行匹配,从而允许在有良好匹配可用时使用额外的单位进行匹配20。该方法的缺陷是很难事先知道合理的半径。2.4核匹配(Kernel matching)核匹配也是一种非参数估计方法,将所有处理组个体与所有对照组个体的加权平均值相匹配,权重由带宽函数和核函数的组合计算而来,权重与处理组和对照组的倾向评分之间的距离成反比。由于对照组的所有个体均对权重有影响,因而可以实现更小的方差。2.5马氏矩阵匹配(Mahalanobis metric matching)马氏矩阵匹配法考虑的是研究对象的整体距离,即基于两个观测值之间的欧里几得距离21。距离 D(i,j)=(u v)TC1(u v),其中 u 和 v 是匹配变量的值(包括 PS 分数),C 是来自完整对照组匹配变量的样本协方差矩阵22。此方法首先随机对受试者进行排序,然后计算处理组个体与所有对照组个体之间的距离,两组个体之间的马氏距离越小,表明协变量在两组之间的分布越均衡,控制混杂因素的影响更小。2.6分层匹配(Stratified matching)分层匹配是根据研究对象的 PS 分位数进行分层,然后在每一层内进行匹配23。最常用的方法是使用 PS 的五分位数将研究对象分为五层,研究证明对连续性的混杂变量分为五层可以消除 90%的该变量所致偏倚24。分层匹配的优点是如果统计分析结果受到未观察到的协变量的影响,分层匹配则非常适用。分层匹配的一个缺点是它所减少的偏倚较少,尤其是在生存分析方面25。3PSM 在 VE 评价中的应用思路疫 苗 上 市 前,随 机 对 照 试 验(andomizedcontrolled trial,CT)是疫苗保护效力证据的主要来源;但在疫苗上市后,由于伦理学和试验设计方面的问题,很难在研究人群中实施 CT26,难以对接种疫苗组和未接种疫苗组的人群实施随机化以减少两组的选择偏倚,所以上市后研究中应用 PSM 对两组人群进行匹配,以平衡两组协变量的差异,达到类随机化的效果27。PSM 应用于 VE 评价的基本步骤如下:首先对已观测的混杂因素(例如年龄、经济水平、职业、接种剂次、疫苗类型等)采用单因素分析,获得具有统计学差异的混杂因素,然后将这些混杂因素作为协变量纳入 PSM 模型,根据实际数据的类型,选择合适的匹配方法进行匹配,在 PSM 前后需要对放入PSM 模型中的协变量进行均衡性检验,以评价接种疫苗组(处理组)和未接种疫苗组(对照组)的协变量是否具有统计学差异。在 VE 评价中,一般常采用 11或者 1n 的最近邻匹配28-30 来均衡两组的混杂因素。匹配后再次对纳入模型的协变量进行均衡性检验,如果显示两组协变量达到均衡,那么再用匹配后的样本作为最终的统计样本对 VE 进行估计。实现 PSM 这一过程可利用、Stata、SAS 等31 统计分析软件,这些软件具有简明的操作程序,并可获得直观的结果。4PSM 应用的优缺点4.1PSM 的优势当研究的混杂因素较多或者结果事件较少时,传统的回归方法可能无法适用32,而 PSM 可以很好地减少组间多种混杂偏倚33;在研究设计阶段无法实行随机化的研究中,使用 PSM021CHINESE JOUNAL OF VACCINES AND IMMUNIZATION Vol29No12023可以使两组对象的基线特征处于平衡,从而达到类随机化的效果34。BENEDETTO U 等14 使用 PSM的卡钳匹配分析了 20 家医院接受冠状动脉旁路移植术(Coronary artery bypass grafting,CABG)的患者,在原始样本中非体外 CABG 循环与院内死亡率降低没有显著关联,经过 PSM 后,两组的混杂因素可比,结果显示非体外 CABG 与院内死亡率降低显著相关。4.2PSM 的局限性PSM 的局限性主要在于无法控制未知或不可测量的混杂因素,因此 PSM 无法平衡其在不同组之间分布不平衡的问题35,目前最常用的匹配形式是 1 1 匹配,但当对照组的数量远远大于处理组时,选择这种匹配方法将极大地降低样本量,从而降低统计效能,影响结果的外推性35。其次是对纳入 PSM 模型的变量选择没有金标准36,研究者根据专业知识和实际情况来选择纳入匹配的变量。PSM 要求处理组与对照组的 PS 相近,有些个体可能无法找到匹配,导致纳入研究的样本量大大减少,从而影响研究的最终推论14,因此PSM 在大样本量的研究队列中可能有更好的效果。5PSM 在 VE 评价中的应用实例PSM 是一种通过计算处理组和对照组的各种基线协变量的 PS 分数,进而通过 PS 分数来进行匹配的一种方法。VE 评价通常是计算接种疫苗组和未接种疫苗组结局事件的发生率来获得 VE,因而PSM 可以广泛用于不同的 VE 评价中。5.1队列研究传统的队列研究匹配通常是针对某一个特定因素例如年龄、性别或者暴露因素来选择对照,而 PSM 是通过计算所有混杂因素的 PS 分数选择对照37,考虑的混杂因素更加全面,因此可以在分析时减少更多的基线混杂因素对结果的干扰。COCHADO-GACIA J 等29 在美国进行了一项针对Ad26COV2S 腺病毒载体疫苗预防新型冠状病毒感染的有效性分析,为了排除新型冠状病毒感染的危险因素对 VE 造成的混杂,研究使用了 PSM 来构建与接种疫苗相似的未接种疫苗队列。接种疫苗队列纳

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开