独立性检验的基本思想及其初步应用(1)高二年级数学主讲人:王沛梅首都经济贸易大学附属中学问题1前面我们学习了回归分析的基本思想及其初步应用.什么是回归分析呢?回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.回顾案例“女大学生的身高和体重的关系”研究过程编号12345678身高/cm165165157170175165155170体重/kg48575054646143598名女大学生的身高和体重数据,如下表所示.第一步:明确解释变量和预报变量,画散点图.回归分析的步骤第一步:明确解释变量和预报变量,画散点图.回归分析的步骤判断:身高和体重具有较好的线性相关关系.第二步:求线性回归方程.线性回归模型:ybxa0.84985.712yx回归方程:问题2如何判断模型拟合效果的好坏?衡量标准最小二乘估计:121()()()niiiniixxyybaybxxx,第三步:残差分析8名女大学生的身高、体重数和相应残差数据,如下表所示:编号12345678身高/cm165165157170175165155170体重/kg4857505464614359残差-6.3732.6272.419-4.6181.1376.627-2.8830.382e初步感知:第1个和第6个样本数据残差较大.(1)列表格初步感知.残差:eyy第三步:残差分析(2)画残差图直观判断.直观判断:第1个和第6个样本点残差较大.第三步:残差分析(3)引入指标准确刻画.准确判断:女大学生的身高解释了64%的体重变化.2R21221()1()niiiniiyyyRy2R越接近于1回归效果越好20.64R编号12345678身高/cm165165157170175165155170体重/kg48575054646143598名女大学生的身高和体重数据,如下表所示:像身高、体重这样的变量称为数值变量.分类变量:这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.性别是否喜欢数学男女喜欢数学不喜欢数学性别喜欢数学吸烟患肺癌主题:两个分类变量之间是否有关系?如何得到准确的判断呢?探究:为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果:思考:吸烟是否对患肺癌有影响?像这样列出的两个分类变量的频数表,称为列联表.不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965吸烟与患肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计987491996549100%2.28%214842100%0.54%7817初步感知:吸烟群体和不吸烟群体患肺癌的可能性存在差异.(1)通过列联表初步感知(2)通过等高条形图直观判断直观判断:吸烟群体和不吸烟群体患...