高考数学专题十一概率与统计11.5变量间的相关关系、统计案例基础篇考点一变量间的相关关系1.线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,称这两个变量线性相关.2.线性经验回归方程与最小二乘法设满足一元线性回归模型的两个变量的n对样本数据为(x1,y1),(x2,y2),…,(xn,yn),由yi=bxi+a+ei(i=1,2,…,n),得|yi-(bxi+a)|=|ei|,显然|ei|越小,表示样本数据点离直线y=bx+a的竖直距离越小.通常用各散点到直线的竖直距离的平方之和Q=来刻画各样本观测数据与直线y=bx+a的“整体接近程度”.当a,b的取值为2ii1(yx)niba时,Q达到最小.将=x+称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计.经验回归直线一定过点(,).^1122211^^()(),()anniiiiiinniiiixxyyxynxybxxxnxybx^y^b^a^b^axy1).2)r>0,表示成对样本数据正相关,散点图中点的分布从左下角到右上角;r<0,表示成对样本数据负相关,散点图中点的分布从左上角到右下角.3)|r|越接近于1,成对样本数据的线性相关程度越强.4.刻画回归效果的方式1)残差图法在残差图中,残差比较均匀地落在以取值为0的横轴为对称轴的水平带状122111222211()()()()()()niiinniiiiniiinniiiixxyyrxxyyxynxyxnxyny3.样本相关系数r区域内,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高.2)残差平方和法残差平方和为(yi-)2,残差平方和越小,模型拟合效果越好.3)利用R2刻画拟合效果R2=1-.R2越大,模型的拟合效果越好,R2越小,模型的拟合效果越差.1ni^iy^2121()()niiiniiyyyy考点二独立性检验1.2×2列联表假设两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为XY合计y1y2x1aba+bx2cdc+d合计a+cb+da+b+c+d2×2列联表给出了成对分类变量数据的交叉分类频数.XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d2.独立性检验1)假定通过简单随机抽样得到了X和Y的抽样数据列联表,如表所示.则χ2=.2)χ2独立性检验中几个常用的小概率值和相应的临界值.2()()()()()nadbcabcdacbdα0.10.050.010.0050.001xα2.7063.8416.6357.87910.828综合篇考法一经验回归方程的求解与应用1.求经验回归方程的步骤1)计算出、、++…+、x1y1+x2y2+…+x...