流行病学数据(shùjù)统计分析策略中南大学湘雅公共卫生学院谭红专(hónɡzhuān)教授第一页,共四十一页。25/1/262概述专题研究的数据分析常规收集的流行病学数据(shùjù)的分析第二页,共四十一页。25/1/263流行病学研究与流行病学数据(shùjù)流行病学数据分析的目的流行病学数据中的变量分类流行病学数据分析的内容第三页,共四十一页。25/1/264狭义的流行病学数据(epidemiologicaldata)指任何来自针对明确研究目的而开展特定流行病学研究所收集的资料。广义的流行病学数据还包括出于其他目的和用途而收集的、可以用来定量地探索疾病健康或医疗卫生服务其他问题(wèntí)的资料。即一切可为流行病学所用的数据。目前的临床大数据是个宝库。第四页,共四十一页。25/1/265流行病学数据分析是针对明确研究问题、具有明确目的、采用特定方法对流行病学数据进行统计整理、统计描述、统计推断和总结。流行病学研究的问题涉及疾病(jíbìng)分布、病因与危险因素、诊断、预防和治疗效果评价等。数据分析的根本是正确地回答有意义的问题,而不是统计学数字游戏。第五页,共四十一页。25/1/266流行病学数据分析的目的估计有关统计学指标,如相对危险度;估计该统计学指标的可信区间;控制可能的混杂因素;分析(fēnxī)剂量反应关系;分析可能的效应修饰因子;分析可能存在的偏倚。第六页,共四十一页。25/1/267典型的流行病学研究中变量可根据其用途分为五类:暴露变量:因,自变量,可以有多个结局变量:果,因变量,是数据分析的核心(héxīn)混杂因素:需要控制效应修饰因素:需要描述其他变量:第七页,共四十一页。25/1/268定性:二分类和多分类(无序多分类)定量:在多数流行病学研究中被转化为分类变量半定量(分级,有序多分类)同一个研究中,因变量和自变量的关系应该是固定的、不能互换。但在不同(bùtónɡ)的研究中,一个变量在这个研究中可能是果,在另一个研究中也可能是因。例如,高血压可能是遗传的结果,血压也可能是心脑血管事件的原因。第八页,共四十一页。25/1/269描述研究对象的数量变动;变量分类和数据整理;描述和比较组间基线资料;估计结局事件发生频率;估计效应大小及其可信区间;识别和控制混杂(hùnzá);识别和测量效应修饰作用;识别和测量剂量反应关系;其他分析。第九页,共四十一页。25/1/2610一、描述研究对象的数量变动数...