温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
高中数学
人教A版选修1-2
1.2独立性检验的基本思想及其初步应用
学案
1
人教
选修
1.2
独立性
检验
基本
思想
及其
初步
应用
1.2 独立性检验的基本思想及其初步应用
1.分类变量的定义.
如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
2.2×2列联表.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
3.独立性检验.
,
1.下列变量中不属于分类变量的是(B)
A.性别 B.吸烟
C.宗教信仰 D.国籍
解析:“吸烟”不是分类变量,“是否吸烟”才是分类变量.故选B.
2.下面是一个2×2列联表
y1
y2
合计
x1
a
21
73
x2
2
25
27
合计
b
46
100
则表中a、b的值分别为(C)
A.94、96 B.52、50
C.52、54 D.54、52
解析:由a+21=73,得a=52,由b+46=100,得b=54.
3.某高校“统计初步”课程的教师随机调查了选修该课程的一些学生情况,具体数据如下表:
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到K2=≈4.844>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为____________.
解析:P(K2>3.841)=0.05,判断出错的可能性为5%.
答案:5%
通过案例理解分类变量、列联表、独立性检验的含义,利用列联表的独立性检验进行估计.
独立性检验的基本思想,随机变量K2的含义.
(1)直观分析的两种方法.
①频率分析.
通过对样本的每个分类变量的不同类别和事件发生的频率的大小比较来分析变量之间是否有关系,通常通过列联表列出两个分类变量进行分析.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
y
x
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
在列联表中,如果两个分类变量没有关系,则应该满足ad-bc≈0.因此|ad-bc|越小,说明两个分量之间的关系越弱;|ad-bc|越大,说明两个分类变量之间的关系越强.
②图形分析.
利用等高条形图来分析两分类变量之间是否具有相关关系,形象、直观地反映两个分类变量之间的总体状态和差异大小,进而推断它们之间是否有关系.
a.绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等,但对应的条形图的高度是相同的,两列的数据对应不同颜色.b.等高条形图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色区域的高度,如果两个高度相差比较明显,就判断两个分类变量之间有关系.
(2)独立性检验及其基本思想.
①独立性检验.
利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
利用上诉公式求出K2的观测值为
k=.
再得出X与Y有关系的程度,通常用到以下数据:
(i)如果k>6.635,在犯错误的概率不超过0.01的前提下认为X与Y有关系;
(ii)如果k>2.706,在犯错误的概率不超过0.1的前提下认为X与Y有关系;
值得注意的是:观察值k越大,越有利于结论“X和Y有关系”,越小越有利于结论“X和Y没有关系”.因此,可以建立一定的规则:当k≥k0时就说X与Y有关系,k<k0时就说X和Y没有关系,故求得观测值后只要与建立的规则进行比较即可得出结论.
②独立性检验的基本思想.
独立性检验的基本思想是要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设“两个分类变量没有关系”成立,在该假设下我们构造的随机变量K2应该很小,如果由观察数据计算得到K2的观测值k很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过P(k≥6.635)≈0.01来评价假设不合理的程度,由实际计算出k>6.635,说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信度为99%,不合理的程度可查下表得出:
1.独立性检验是对两个分类变量间是否有关系的一种案例分析方法,其分析方法有:等高条形图法和利用假设的思想方法,计算出某一个随机变量K2的观测值来进行判断.
2.在等高条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例为,也可以估计满足条件X=x2的个体中具有Y=y2的个体
所占的比例为,两个比例的值相差越大,两个分类变量相关的可能性就越大.
3.独立性检验的一般步骤:
(1)根据样本数据制成2×2列联表;
(2)根据公式K2=计算K2的观测值;
(3)比较K2与临界值的大小关系作统计推断.
1.在等高条形图形中,下列哪两个比值相差越大,“两个分类变量有关系”成立的可能性越大(C)
A.与 B.与
C.与 D.与
2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表;
男
女
合计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由K2=算得,
K2=≈7.8.
附表:
P(F2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
参照附表,得到的正确结论是(A)
A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
3.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:
专业
性别
非统计专业
统计专业
男
13
10
女
7
20
为了判断主修统计专业是否与性别有关系,根据表中数据得到,
k=≈4.844,因为k>3.841,所以确定主修统计专业与性别有关系,那么这种判断出错的可能性为________.
解析:∵k=4.844>3.841,∴有95%的把握可以确定主修统计专业与性别有关,那么这种判断出错的可能性为5%.
答案:5%