1.2独立性检验的基本思想及其初步应用【自主预习】1.分类变量和列联表(1)分类变量“”变量的不同值表示个体所属的_________,像这样的变量称为分类变量.不同类别(2)列联表①定义:列出的两个分类变量的_______称为列联表.②2×2列联表:一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×列联表)为频数表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d2.等高条形图(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否_________,常用等高条形图展示列联表数据的_________.(2)如果直接观察等高条形图发现______和______相差很大,就判断两个分类变量之间有关系.相互影响频率特征aabccd3.独立性检验定义利用随机变量K2“”来判断两个分类变量有关系的方法称为独立性检验公式22n(adbc)Kn__________abcdacbd,其中()()()()a+b+c+d具体步骤①确定α,根据实际问题的需要确定容许推断“”两个分类变量有关系犯错误概率的上界α,然后查表确定________.②计算K2,利用公式计算随机变量K2的________.③下结论,如果_____“,就推断X与Y”有关系,这种推断_____________不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y”有关系,或者在样本数据中__________________“支持结论X与Y”有关系临界值k0观测值kk≥k0犯错误的概率没有发现足够证据【即时小测】1.下列变量中不属于分类变量的是()A.性别B.吸烟C.宗教信仰D.职业【解析】选B.“吸烟”不是分类变量.“是否吸烟”才是分类变量.2.下面是2×2列联表.y1y2总计x1332154x2a1346总计b34则表中a,b处的值应为()A.33,66B.25,50C.32,67D.43,56【解析】选A.由2×2列联表知a+13=46,所以a=33,又b=a+33,所以b=33+33=66.3.如果在犯错误的概率不超过0.05的前提下认为事件A和B有关,那么具体算出的数据满足()A.K2>3.841B.K2<3.841C.K2>6.635D.K2<6.635【解析】选A.根据独立性检验的临界值及其与K2大小关系的意义可知,在犯错误的概率不超过0.05的前提下认为事件A和B有关时,统计量K2>3.841.【知识探究】探究点12×2列联表1.2×2列联表中研究的变量是什么变量?提示:分类变量.2.2×2列联表中{x1,x2},{y1,y2}的意义是什么?提示:{x1,x2},{y1,y2}表示分类变量x,y的取值.【归纳总结】1.“”对分类变量的三点说明(1)“”“”“”这里的变量和值都应作为广义的变量和值进行理解.例如,对于性别变量,其取值为男和女...