第6章方差分析主要内容6.1方差分析概述6.2ANOVA/GLM过程6.3单因素方差分析6.4双因素方差分析6.5均值估计与多重比较6.1方差分析概述•方差分析(analysisofvariance,ANOVA)也称为变异数分析。是常用的统计方法之一。其应用广泛,分析效率高,节省样本含量。•由英国统计学家R.A.Fisher在1920年代提出,以F命名其统计量,故方差分析又称F检验。•主要原理:根据研究目的和设计类型,将各组数据的总变异中的离均差平方和及其自由度分别分解成相应的若干部分,然后求各相应部分的变异;再用各部分的变异与组内(或误差)变异进行比较,得出统计量F值;最后根据F值的大小确定P值,作出统计推断。•方差分析的应用条件为:–各样本须是相互独立的随机样本;–各样本来自正态分布总体;–各总体方差相等,即方差齐性。在SAS中,正态性可用第5章介绍的方法来验证,也可通过本章介绍的“残差的正态性检验”来验证,方差齐性可以在方差分析的过程进行验证,而独立性可由试验的随机化确定。•方差分析的用途很广,包括:–两个或多个样本均数间的比较;–分析一个、两个或多个因素对试验结果的作用和影响;–分析两个或多个因素间的交互作用;–两样本的方差齐性检验等。6.1方差分析概述6.2ANOVA/GLM过程方差分析的SAS程序:•在SAS系统中一般利用PROCANOVA过程和PROCGLM过程进行方差分析。而PROCANOVA过程一般只能用于平衡数据的方差分析。所谓平衡数据指的是所有效应因子的交叉水平上,样本数相同,否则称为非平衡数据。它比PROCGLM过程的运行速度要快,要求的存贮空间也要小一些。PROCGLM过程可用于平衡和非平衡数据的各种方差分析、协方差分析以及广义线性模型分析。6.2ANOVA/GLM过程ANOVA过程一般使用格式PROCANOVADATA=SAS数据集<选项列表>;CLASS变量列表;MODEL因变量列表=自变量列表选项列表>;MEANS效应列表选项列表>;RUN;•PROCANOVA语句后主要控制选项:–MANOVA要求分析中删除因变量为缺失值的观测–NOPRINT抑制所有的结果列表输出–OUTSTAT=指定输出包括模型中每个效应的离差平方和、F统计量和P值的输出数据集–PLOTS=NONE抑制ODS图形输出6.2ANOVA/GLM过程ANOVA过程中的定义语句含义:•CLASS语句用来指定样本分组的分类变量,CLASS语句是必需的,而且必须位于MODEL语句之前;•MODEL语句用于定义因变量和自变量效应,给出模型表达式。若未指定自变量的效应,则只拟合截距。四种主要的效应模型:1)主效应模型:y=abc2)交互效应模型:y=a...