2025年1月20日星期一2025年1月20日星期一11医用SAS统计分析第五讲2025年1月20日星期一2025年1月20日星期一22一、多元线性回归基本概念多元线性回归简称多元回归,是研究一个应变量与多个自变量间线性依存关系数量变化规律的一种方法。多元线性回归方程mmXbXbXbbY22110ˆ式中:b0为回归方程常数项,bj(j=1,2,┅,m)为偏回归系数,即在其他自变量固定的条件下,Xj改变一个单位时应变量的改变量。2025年1月20日星期一2025年1月20日星期一33多元线性回归方程的应用预测应变量的估计值探索影响应变量y的主要因素当X为某一定值时,估计应变量y的容许区间当X为某一定值时,估计其应变量的总体均数的置信区间YˆYStY,ˆiYˆYˆYStYˆ,ˆ2025年1月20日星期一2025年1月20日星期一44语句格式同单变量线性回归基本相同。procreg[选项];model应变量=自变量名列/[选项];必选语句,定义回归分析模型procreg语句的[选项]data=数据集指明回归分析所用的数据集。outset=数据集指定一个输出数据集,用以存储回归分析所得的参数估计。simple输出每个变量的简单统计结果。2025年1月20日星期一2025年1月20日星期一55model语句的[选项]selection=method规定变量筛选方法,method可以是以下几种选项:•forward(或f)前进法,按照sle规定的P值从无到有依次选一个变量进入模型•backward(或b)后退法,按照sls规定的P值从含有全部变量的模型开始,以次剔除一个变量。•stepwise逐步法,按照sle的标准依次选入变量,同时对模型中现有的变量按sls的标准剔除不显著的变量。注:[选项]中没有selection语句时,模型中含有全部自变量的回归模型。sle=概率值入选标准,规定变量入选模型的显著性水平,前进法默认为0.5,逐步法默认为0.15。sls=概率值剔除标准,指定变量保留在模型的显著性水平,后退法默认为0.1,逐步法默认为0.15。2025年1月20日星期一2025年1月20日星期一66stb输出各自变量的标准偏回归系数。cli输出个体y值的95%容许区间上下限clm输出预测值均值的95%可信区间上下限。P输出实际值Yi,预测值、残差及其标准误。tol输出各自变量的容许值。0≤tol值≤1,越接近于0,共线性越严重。vif输出各自变量的方差膨胀因子。当vif≥10时,可认为多元共线性严重存在。collin要求详细分析自变量之间的共线性,给出信息矩阵的特征根、条件指数和方差比,当条件指数≥10,方差比>0.5时,可认为存在多...