温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
3.2
独立性
检验
基本
思想
及其
初步
应用
3. 2.1独立性检验的基本思想及其初步应用
教学目标
(1)通过对典型案例的探究,了解独立性检验(只要求列联表)的基本思想、方法及初步应用;
(2)经历由实际问题建立数学模型的过程,体会其基本方法。
教学重点:独立性检验的基本方法
教学难点:基本思想的领会及方法应用
教学过程
一、问题情境
5月31日是世界无烟日。有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手。这些疾病与吸烟有关的结论是怎样得出的呢?我们看一下问题:
某医疗机构为了了解肺癌与吸烟是否有关,进行了一次抽样调查,共调查了9965个人,其中吸烟者2148人,不吸烟者7817人。调查结果是:吸烟的2148人中有49人患肺癌,2099人未患肺癌;不吸烟的7817人中有42人患肺癌,7775人未患肺癌。
问题:根据这些数据能否断定“患肺癌与吸烟有关”?
二、学生活动
(1)引导学生将上述数据用下表(一)来表示:(即列联表)
不患肺癌
患肺癌
总计
不吸烟
7775
42
7817
吸烟
2099
49
2148
总计
9874
91
9965
(2)估计吸烟者与不吸烟者患肺癌的可能性差异:
在不吸烟者中,有≈0.54%的人患肺癌;
在吸烟的人中,有≈2.28%的人患肺癌。
问题:由上述结论能否得出患肺癌与吸烟有关?把握有多大?
三、建构数学
1、从问题“吸烟是否与患肺癌有关系”引出独立性检验的问题,借助样本数据的列联表,柱形图和条形图的展示,使学生直观感觉到吸烟和患肺癌可能会有关系。但这种结论能否推广到总体呢?要回答这个问题,就必须借助于统计理论来分析。
2、独立性检验:
(1)假设:患肺癌与吸烟没有关系。即:“吸烟与患肺癌相互独立”。用A表示不吸烟,B表示不患肺癌,则有P(AB)=P(A)P(B)
若将表中“观测值”用字母代替,则得下表(二):
患肺癌
未患肺癌
合计
吸烟
不吸烟
合计
学生活动:让学生利用上述字母来表示对应概率,并化简整理。
思考交流:越小,说明患肺癌与吸烟之间的关系越 (强、弱)?
(2)构造随机变量(其中)
由此若成立,即患肺癌与吸烟没有关系,则K2的值应该很小。把表中的数据代入计算得K2的观测值k约为56.632,统计学中有明确的结论,在成立的情况下,随机事件P(K2≥6.635)≈0.01。由此,我们有99%的把握认为不成立,即有99%的把握认为“患肺癌与吸烟有关系”。
上面这种利用随机变量K2来确定是否能以一定把握认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验。
说明:估计吸烟者与不吸烟者患肺癌的可能性差异是用频率估计概率,利用K2进行独立性检验,可以对推断的正确性的概率作出估计,观测数据取值越大,效果越好。在实际应用中,当均不小于5,近似的效果才可接受。
(2)这里所说的“患肺癌与吸烟有关系”是一种统计关系,这种关系是指“抽烟的人患肺癌的可能性(风险)更大”,而不是说“抽烟的人一定患肺癌”。
(3)在假设成立的情况下,统计量K2应该很小,如果由观测数据计算得到K2的观测值很大,则在一定程度上说明假设不合理(即统计量K2越大,“两个分类变量有关系”的可能性就越大)。
3、对于两个分类变量A和B,推断“A和B有关系”的方法和步骤为:
①利用三维柱形图和二维条形图;
②独立性检验的一般步骤:
第一步,提出假设:两个分类变量A和B没有关系;
第二步,根据2×2列联表和公式计算K2统计量;
第三步,查对课本中临界值表,作出判断。
4、独立性检验与反证法:
反证法原理:在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立;
独立性检验原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立。
四、数学运用
例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?
① 第一步:教师引导学生作出列联表,并分析列联表,引导学生得出“秃顶与患心脏病有关”的结论;
第二步:教师演示三维柱形图和二维条形图,进一步向学生解释所得到的统计结果;
第三步:由学生计算出的值;
第四步:解释结果的含义.
② 通过第2个问题,向学生强调“样本只能代表相应总体”,这里的数据来自于医院的住院病人,因此题目中的结论能够很好地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出现错误,除非有其它的证据表明可以进行这种推广.
变式练习:课本P97练习
【板书设计】:
【作业布置】:课本P97习题3.2第1题
3.2.1独立性检验的基本思想及其初步应用
课前预习
阅读教材P91-P95,了解相关概念,如:分类变量、列联表、独立性检验。
学习目标
(1)通过对典型案例的探究,了解独立性检验(只要求列联表)的基本思想、方法及初步应用;
(2)经历由实际问题建立数学模型的过程,体会其基本方法。
学习重点:独立性检验的基本方法
学习难点:基本思想的领会
学习过程
一、情境引入
5月31日是世界无烟日。有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手。这些疾病与吸烟有关的结论是怎样得出的呢?我们看一下问题:
某医疗机构为了了解肺癌与吸烟是否有关,进行了一次抽样调查,共调查了9965个人,其中吸烟者2148人,不吸烟者7817人。调查结果是:吸烟的2148人中有49人患肺癌,2099人未患肺癌;不吸烟的7817人中有42人患肺癌,7775人未患肺癌。
问题:根据这些数据能否断定“患肺癌与吸烟有关”?
二、学生活动
【自主学习】
(1)将上述数据用下表(一)来表示:
不患肺癌
患肺癌
总计
不吸烟
吸烟
总计
(2)估计吸烟者与不吸烟者患肺癌的可能性差异:
在不吸烟者中患肺癌的人约占多大比例? ;
在吸烟的人中患肺癌的人约占多大比例? 。
问题:由上述结论能否得出患肺癌与吸烟有关?把握有多大?
【合作探究】
1、观察、分析样本数据的列联表和柱形图、条形图,你能得出什么结论?
2、该结论能否推广到总体呢?
3、假设:患肺癌与吸烟没有关系。则两事件发生的概率有何关系?
不患肺癌
患肺癌
总计
不吸烟
a
b
a+b
吸烟
c
d
c+d
总计
a+c
b+d
a+b+c+d
试用上表(二)中字母表示两概率及其关系,并化简该式。你能得到何结论?
4、构造随机变量(其中),结合3中结论,若成立,则K2应该很 (大、小)
根据表(一)中的数据,利用4中公式,计算出K2的观测值,该值说明什么?(统计学中有明确的结论,在成立的情况下,P(K2≥6.635)≈0.01。)
5、结合表(二)和三维柱形图、二维条形图如何判断两个分类变量是否有关系?利用独立性检验呢?二者谁更精确?
【当堂检测】
在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?
学校:二中 学科:数学 编写人: 游恒涛 审稿人:马英济
3.2.2独立性检验的基本思想及其初步应用
教学目标
通过对典型案例的探究,进一步巩固独立性检验的基本思想、方法,并能运用K2进行独立性检验.
教学重点:独立性检验的基本方法
教学难点:基本思想的领会及方法应用
教学过程
一.学生活动
练习:
(1)某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集哪些数据?女教授人数,男教授人数,女副教授人数,男副教授人数。
(2)某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
专业
性别
非统计专业
统计专业
男
13
10
女
7
20
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到
K2,∵K2,
所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 .(答案:5%)
附:临界值表(部分):
(K2≥k0)
0.10
0.05
0.025
0.010
k0
2.706
3.841
5.024
6.635
二.数学运用
例1 为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:
喜欢数学课程
不喜欢数学课程
总 计
男
37
85
122
女
35
143
178
总 计
72
228
300
由表中数据计算得到的观察值. 在多大程度上可以认为高中生的性别与是否数学课程之间有关系?为什么?
(学生自练,教师总结)
强调:①使得成立的前提是假设“性别与是否喜欢数学课程之间没有关系”.如果这个前提不成立,上面的概率估计式就不一定正确;
②结论有95%的把握认为“性别与喜欢数学课程之间有关系”的含义;
③在熟练掌握了两个分类变量的独立性检验方法之后,可直接计算的值解决实际问题,而没有必要画相应的图形,但是图形的直观性也不可忽视.
例2、为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果如表所示。根据所选择的193个病人的数据,能否作出药的效果与给药方式有关的结论?
有效
无效
合计
口服
58
40
98
注射
64
31
95
合计
122
71
193
分析:在口服的病人中,有的人有效;在注射的病人中,有的人有效。从直观上来看,口服与注射的病人的用药效果的有效率有一定的差异,能否认为用药效果与用药方式一定有关呢?下面用独立性检验的方法加以说明。
说明:如果观测值K2≤2.706,那么就认为没有充分的证据显示“A与B有关系”,但也不能作出结论“成立”,即A与B没有关系
小结:独立性检验的方法、原理、步骤
三、巩固练习:
某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:请问有多大把握认为“高中生学习状况与生理健康有关”?
不健康
健 康
总计
不优秀
41
626
667
优 秀
37
296
333
总 计
78
922
1000
3.2.2独立性检验的基本思想及其初步应用
学习目标
通过对典型案例的探究,进一步巩固独立性检验的基本思想、方法,并能运用K2进行独立性检验.
学习重点:独立性检验的应用
学习过程
一.前置测评
(1)某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集哪些数据? 。
(2)某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
专业
性别
非统计专业
统计专业
男
13
10
女
7
20
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到
K2,∵K2≥3.841,
所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 。
附:临界值表(部分):
(K2≥k0)
0.10
0.05
0.025
0.010
k0
2.706
3.841
5.024
6.635
二.典型例题
例1 为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:
喜欢数学课程
不喜欢数学课程
总 计
男
37
85
122
女
35
143
178
总 计
72
228
300
由表中数据计算得到的观察值k≈4.514. 在多大程度上可以认为高中生的性别与是否数学课程之间有关系?为什么?
例2、为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果如表所示。根据所选择的193个病人的数据,能否作出药的效果与给药方式有关的结论?
有效
无效
合计
口服
58
40
98
注射
64
31
95
合计
122
71
193
谈一谈:结合例1和例2你如何理解独立性检验。
三、巩固练习:
某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:请问有多大把握认为“高中生学习状况与生理健康有关”?
不健康
健 康
总计
不优秀
41
626
667
优 秀
37
296
333
总 计
78
922
1000
9