实用
药效
统计
方法
统计资料的常用分析方法,第一页,共三十一页。,主要内容,统计资料的分类常用统计方法的选择随访资料的统计方法小结,第二页,共三十一页。,正确地进行试验数据资料的分类是统计资料整理的前提。在调查或试验中,由观察、测量所得的数据资料按其性质的不同,一般可以分为数量性状资料、质量性状资料和半定量等级资料三大类。,统计资料的分类,第三页,共三十一页。,数量性状(quantitative character)是指能够以测量、计量或计数的方式表示其特征的性状。观察测定数量性状而获得的数据就是数量性状资料 数量性状资料的获得有测量和计数两种方式,因而数量性状资料 又分为计量资料和计数资料两种。,1.1 数量性状资料,第四页,共三十一页。,用测量方式获得的数量性状资料,即用度、量、衡等计量工具直接测定获得的数量性状资料。其数据是用长度、容积、重量等来表示。这种资料的各个观测值不一定是整数,两个相邻的整数间可以有带小数的任何数值出现,其小数位数的多少由度量工具的精度而定,它们之间的变异是连续性的。因此,计量资料也称为连续性变异资料。,1.1.1 计量资料,第五页,共三十一页。,1.1.2 计数资料 指用计数方式获得的数量性状资料。在这类资料中,它的各个观察值只能以整数表示,在两个相邻整数间不得有任何带小数的数值出现。这些观察值只能以整数来表示,各观察值是不连续的,因此该类资料也称为不连续性变异资料或间断性变异资料。,第六页,共三十一页。,1.2 质量性状资料 质量性状(qualitative character)是指能观察到而不能直接测量的,只能用文字来描述其特征的性状,如食品颜色、风味等等。这类性状本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察结果作数量化处理,其方法有以下两种:,第七页,共三十一页。,1.2.1 统计次数法 在一定的总体或样本中,根据某一质量性状的类别统计其次数,以次数作为质量性状的数据。例如,苹果中全红果个数与半红果个数。由质量性状数量化而得来的资料又叫 次数资料。,1.2.2评分法 对某一质量性状,因其类别不同,分别给予评分。例如,分析面包的质量,可以按照国际面包评分细那么进行打分,综合评价面包质量。新产品开发中的评价打分等等。,第八页,共三十一页。,1.3 半定量等级资料 半定量或等级资料(semi-quantitative or ranked data)是指将观察单位按所考察的性状或指标的等级顺序分组,然后清点各组观察单位的次数而得的资料。这类资料既有次数资料的特点,又有程度或量的不同。如某种果实的褐变程度是视果实变色面积将其分组,然后统计各级别果数。,第九页,共三十一页。,三种不同类型的资料相互间是有区别的,但有时可根据研究的目的和统计方法的要求将一种类型资料转化成另一种类型的资料。例如,酸奶中的乳杆菌总数得到的资料属于计数资料,根据化验的目的,可按乳杆菌总数正常或不正常分为两组,清点各组的次数,计数资料就转化为质量性状次数资料;如果按乳杆菌总数过高、正常、过低分为三组,清点各组次数,就转化成了半定量资料。,第十页,共三十一页。,关键:知道资料的性质、实验设计类型及检验的目的。U检验、t检验、方差分析、卡方检验、非参数检验。U检验适于大样本或总体方差能看出t检验适于小样本检验,单样本或两个样本平均数间的比较方差分析适于多个平均数间的比较卡方检验适于构成比、适合性的计数资料,统计方法的选择,第十一页,共三十一页。,非参数检验一般用于:不满足于正态和方差齐性条件的计量资料;无确切值,只是某值或某值的计量资料。对于分布不知是否正态的小样本资料;对于只能用严重程度、优劣等级的半定量等级资料。注:对于计量资料,不满足参数检验条件的,一是尝试变量变换使其满足参数条件,二是用非参数检验。对于等级资料,常用非参数检验。能用参数检验的计量资料用非参的方法,会降低检验效能。,第十二页,共三十一页。,不同资料相应的常用统计方法,计量资料:t检验,方差分析前提条件是数据呈正态性和方差齐性计数资料:x2检验等级资料:秩和检验,第十三页,共三十一页。,2.1.1 两组独立样本比较2.1.1.1 资料符合正态分布,且两组方差齐性,及独立性,可直接采用t检验。2.1.1.2 资料不符合正态分布1数据转换如对数转换等使之服从正态分布转换后的数据采用t检验;2直接采用非参数检验如Wilcoxon检验。2.1.1.3 资料方差不齐1t检验前提是资料满足正态性;2采用非参数检验如Wilcoxon检验。,2.1 计量资料的常用统计方法,第十四页,共三十一页。,2.1.2 两组配对样本的比较2.1.2.1 两组差值服从正态分布,采用配对t检验。2.1.2.2 两组差值不服从正态分布,采用Wilcoxon的符号配对秩和检验。2.1.3 多组完全随机样本比较单因素方差分析2.1.3.1 资料符合正态分布,且各组方差齐,直接采用完全随机的方差分析。如检验结果具有统计学意义,那么进一步作两两比较,两两比较的方法有LSD检验,Dunnett检验,SNK检验等。其中Dunnett 检验适用于g-1个实验组与一个对照组均数差异的多重比较。,第十五页,共三十一页。,2.1.3.2 资料不符合正态分布,或各组方差不齐1数据转换如对数转换等使之服从正态分布或方差齐性转换后数据采用F检验;2直接采用非参数检验如Kruscal-Wallis法。如果检验结果为有统计学意义,那么进一步作两两比较。即采用Mann-Whitney U检验进行各组间的两两比较,第十六页,共三十一页。,需要注意的问题:1一般来说,如果是大样本,比方各组例数大于50,可以不作正态性检验,直接采用t检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。2当进行多组比较时,易犯仅比较其中的两组,而不顾其他组的错误,这样作容易增大。应该先作总的各组间的比较,如果总的来说差异有统计学意义,然后才能作其中任意两组的比较。绝不能对其中的两组直接采用t检验,这样即使得出结果也未必正确,第十七页,共三十一页。,2.2.1 单样本的检验 Wilcoxon符号秩检验2.2.2 两个独立样本的检验 Mann-Whitney检验:也称为Mann-Whitney U检验(Mann-Whitney U test)。用于确定两个总体间是否存在差异的一种非参数检验方法对应的参数方法两个独立样本的t检验 Mann-Whitney检验不需要诸如总体服从正态分布且方差相同等之类的假设。,2.2 等级资料的常用统计方法,第十八页,共三十一页。,2.2.3 两个配对样本的检验 Wilcoxon符号秩检验 检验两个总体的分布是否相同,或者说两个总体的中位数是否相同。对应的参数方法两个配对样本的t检验。与Mann-Whitney检验不同,Wilcoxon符号秩检验是基于两个相关样本的检验。2.2.4 k个独立样本的检验 Kruskal-Wallis检验两独立样本的Mann-Whitney U检验在多个样本下的推广。用于检验多个总体是否相同对应的参数方法方差分析。,第十九页,共三十一页。,随访资料主要用于观察、比较两组肾移植病人手术后的生存时间和结局。在该研究中除考虑随访对象的结局(生存或死亡)外,还应考虑随访对象的“生存时间。,随访研究过程中研究对象可能会失访,或死于其他疾病,或因研究经费和时间的限制不可能等到所有的观察对象都出现结果才中止试验,这种现象称为截尾(censoring)或终检。,随访资料的统计方法,第二十页,共三十一页。,生存分析survival analysis为既考虑结果,又考虑生存时间的一种统计方法,可充分利用截尾数据所提供的不完全信息,对生存时间的分别特征进行描述,对影响生存时间的主要因素进行分析。,第二十一页,共三十一页。,3.1随访研究及其特点,3.1.1 生存时间survival time,狭 义,指某病患者从发病到死亡所经历的时间。,广 义,指从某种“起始事件开始随访,到被观察对象出现某种“终点事件所经历的时间。,起始事件 是反映研究对象生存过程的起始特征 的事件。终点事件 指研究者所关心的特定结局。,第二十二页,共三十一页。,生存时间举例,起始事件 终点事件 服药 痊愈 手术切除 死亡 染毒 出现毒性反响 化疗 缓解 缓解 恶化 正常 发病,第二十三页,共三十一页。,3.2 观察结果(outcome),观察结果就是我们关心的终点事件。在生存分析中称终检变量(censored variable)或死亡变量(dead variable)。当被观察对象出现终点事件记为1,否那么记为0(统称为截尾)。,第二十四页,共三十一页。,3.3 生存时间的类型,1完全数据complete data从起点至死亡死于所研究疾病所经历的时间。出现结局事件。2截尾数据删失数据,censored data从起点至截尾点所经历的时间。未出现结局事件。截尾原因:失访,死于其它疾病或原因,观察结束时尚未出现终点事件等。,第二十五页,共三十一页。,3.4 生存时间的统计方法,采用生存分析Survival项下的Kaplan-Meier法进行统计分析具体统计方法选择Log-rank检验。对于有确切发病时间的动物,那么取其发病时间状态:1=发病;时间:具体发病时间进行统计;对于到观察结束时如免疫后35天仍未发病的动物,那么按照截尾数据,将此局部动物均按照“状态:0=未发病;时间:35天进行数据录入。,第二十六页,共三十一页。,第二十七页,共三十一页。,小 结,第二十八页,共三十一页。,第二十九页,共三十一页。,Thank You,第三十页,共三十一页。,内容总结,统计资料的常用分析方法。正确地进行试验数据资料的分类是统计资料整理的前提。关键:知道资料的性质、实验设计类型及检验的目的。对于只能用严重程度、优劣等级的半定量等级资料。能用参数检验的计量资料用非参的方法,会降低检验效能。2.1.2.1 两组差值服从正态分布,采用配对t检验。对应的参数方法两个配对样本的t检验。Thank You,第三十一页,共三十一页。,