3分类变量与列联表统计分析学习目标1.了解分类变量的意义.2.了解2×2列联表的意义.3.了解随机变量K2的意义.4.通过对典型案例分析,了解独立性检验的基本思想和方法.问题导学题型探究达标检测内容索引问题导学如何判定“喜欢体育还是文娱与性别是否有联系”?答案可通过表格与图形进行直观分析,也可通过统计分析定量判断.知识点一分类变量及2×2列联表思考山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表:体育文娱合计男生210230440女生60290350合计270520790梳理(1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表①定义:列出的两个分类变量的频数表,称为列联表.y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d②2×2列联表一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)为下表.2.如果通过直接计算或等高条形图发现a和c相差很大,就判断两个分类变量之间有关系.知识点二等高条形图1.与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.a+bc+d3.独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.知识点三独立性检验nad-bc21.定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.2.K2=a+bc+da+cb+d,其中n=a+b+c+d为样本容量.(2)利用公式计算随机变量K2的观测值k.(3)如果,就推断“X与Y有关系”,这种推断犯错误的概率不超k≥k0过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.[思考辨析判断正误]1.列联表中的数据是两个分类变量的频数.(√)2.事件A与B的独立性检验无关,即两个事件互不影响.(×)3.K2的大小是判断事件A与B是否相关的统计量.(√)题型探究例1为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:类型一等高条形图的应用组别阳性数阴性数总计铅中毒病人29736对照组92837总计383573试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?解答反思与感悟在等高条形图中,可以估计满...