温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
1.1
回归
分析
基本
思想
及其
初步
应用
课时
§1.1 回归分析的基本思想及其初步(一)
【学情分析】:
教学对象是高二文科学生,学生已经初步学会用最小二乘法建立线性回归模型的知识,并能用所学知识解决一些简单的实际问题。回归分析是数理统计中的重要内容,在教学中,要结合实例进行相关性检验,理解只有两个变量相关性显著时,回归方程才具有实际意义。在起点低的班级中注重让学生参与实践,结合画图表的方法整理数据,鼓励学生通过收集数据,经历数据处理的过程,从而认识统计方法的特点,达到学习的目的。
【教学目标】:
(1)知识与技能:
回忆线性回归模型与函数模型的差异,理解用最小二乘法求回归模型的步骤,了解判断两变量间的线性相关关系的强度——相关系数。
(2)过程与方法:
本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的回归直线方程。
(3)情感态度与价值观:
从实际问题中发现自己已有知识的不足之处,激发学生的好奇心和求知欲,培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进取。
【教学重点】:
1、了解线性回归模型与函数模型的差异;
2、了解两变量间的线性相关关系的强度——相关系数。
【教学难点】:
1、了解线性回归模型与一次函数模型的差异;
2、了解偏差平方和分解的思想。
【课前准备】:
课件
【教学过程设计】:
教学环节
教学活动
设计意图
一、创设情境
问题一:一般情况下,体重与身高有一定的关系,通常个子较高的人体重比较大,但这是否一定正确?(是否存在普遍性)
提出问题,引导学生判断体重与身高之间的关系(函数关系、相关关系)
(学生思考、讨论。)
问题二:统计方法解决问题的基本过程是什么?
提出问题,引导学生回忆用最小二乘法求回归直线方程的方法。
(由学生回忆、叙述)
回归分析的基本过程:⑴画出两个变量的散点图;
⑵判断是否线性相关
⑶求回归直线方程(利用最小二乘法)
⑷并用回归直线方程进行预报
复习回归分析用于解决什么样的问题。
复习回归分析的解题步骤
二、例题选讲
问题三:思考例1:从某大学中随机选取8名女大学生,其身高和体重数据如表所示。求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。
编号
1
2
3
4
5
6
7
8
身高/cm
165
165
157
170
175
165
155
170
体重/kg
48
57
50
54
64
61
43
59
题目中表达了哪些信息?
师:读例1的要求,引导学生理解例题含义。
(例题含义:①数据体重与身高之间是一种不确定性的关系
②求出以身高为自变量x,体重为因变量y的回归方程。
③由方程求出当x = 172时,y的值。
生:思考、讨论、叙述自己的理解,归纳出题目中的信息。
根据以前所学的知识,让学生自己动手求出回归方程
求解过程如下:
①画出散点图,判断身高x与体重y之间存在什么关系(线性关系)?
②列表求出相关的量,并求出线性回归方程
代入公式有
所以回归方程为
③利用回归方程预报身高172cm的女大学生的体重约为多少?
当时,
引导学生复习总结求线性回归方程的步骤:
第一步:作散点图—→第二步:求回归方程—→第三步:代值计算
复习统计方法解决问题的基本过程。
学生动手画散点图,老师用EXCEL的作图工作演示,并引导学生找出两个变量之间的关系。
学生经历数据处理的过程,并借助EXCEL的统计功能鼓励学生使用计算器或计算机等现代工具来处理数据。
三、探究新知
问题四:身高为172cm的女大学生的体重一定是60.316kg吗?
(不一定,但一般可以认为她的体重在60.316kg左右.)
师:提出问题,引导学生比较函数模型与线性回归模型的不同,并引出相关系数的作用。
生:思考、讨论、解释
解释线性回归模型与一次函数的不同
从散点图可观察出,女大学生的体重和身高之间的关系并不能用一次函数来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm的3名女大学生的体重分别为48kg、57kg和61kg,如果能用一次函数来描述体重与身高的关系,那么身高为165cm的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果(即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型,其中残差变量中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.
问题五:如何衡量两个变量之间线性相关关系的强弱呢?
相关系数:
相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义;相关系数的绝对值越接近于0,两个变量的线性相关关系几乎不存在,它们的散点图越离散,通常当大于时,认为两个变量有很强的线性相关关系。
问题六:例1中由体重与身高建立的线性相关关系有无意义?
生:动手计算本例中两个变量之间的相关系数,,表明体重与身高有很强的线性相关关系,从而表明我们建立的回归模型是有意义的。
引导学生了解线性回归模型与一次函数的不同
引导学生在解决具体问题的过程中,通常先进行相关性的检验,确认两变量间的线性相关关系的强弱再求线性回归方程。
结合实例的分析和研究,正确地进行相关性检验。
四、巩固练习
1. 假设关于某设备的使用年限x和支出的维修费用y(万元),有如下表的统计资料。试求:
使用年限x
2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
⑴画出数据的散点图;
⑵若x与y呈线性相关关系,求线性回归方程
y = bx + a 的回归系数a、b;
⑶估计使用年限为10年时,维修费用是多少?
答案:⑴散点图如图:
⑵由已知条件制成下表:
1
2
3
4
5
2
3
4
5
6
2.2
3.8
5.5
6.5
7.0
4.4
11.4
22.0
32.5
42.0
4
9
16
25
36
; ;
;
于是有
⑶ 回归直线方程是,
当时,(万元)
即估计使用10年时维修费用是12.38万元。
巩固知识
五、小结
1. 熟练掌握求线性回归方程的步骤;
⑴画出两个变量的散点图;
⑵判断是否线性相关;
⑶求回归直线方程(利用最小二乘法);
⑷并用回归直线方程进行预报。
2. 理解线性回归模型与一次函数的不同;
一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.
3. 了解相关系数的计算与解释。
相关系数:
相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义;相关系数的绝对值越接近于0,两个变量的线性相关关系几乎不存在,它们的散点图越离散,通常当大于时,认为两个变量有很强的线性相关关系。
反思归纳
练习与测试
1. 设有一个回归方程为,则变量增加一个单位时,则( C )
A.平均增加个单位 B.平均增加个单位
C.平均减少个单位 D.平均减少个单位
2. 在画两个变量的散点图时,下面哪个叙述是正确的( B )
A.预报变量在轴上,解释变量在轴上
B.解释变量在轴上,预报变量在轴上
C.可以选择两个变量中任意一个变量在轴上
D.可以选择两个变量中任意一个变量在轴上
3. 已知x与y之间的一组数据:
x
0
1
2
3
y
1
3
5
7
则y与x的线性回归方程为必过( D )
A.(2,2)点 B.(1.5,0)点 C.(1,2)点 D.(1.5,4)点
4. 已知两个相关变量与具有线性相关关系,当取值1,2,3,4时,通过观测得到的值分别为1.2,4.9,8.1,12.8,这组样本点的中心是( D )
A.(2,4.9) B.(3,8.1) C.(2.5,7) D.(2.5,6.75)
5. 一位母亲记录了儿子3—9岁的身高,数据(略),由此建立的身高与年龄的回归模型为y=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( C )
A.身高一定是145.83cm B.身高在145.83cm以上
C.身高在145.83cm左右 D.身高在145.83cm以下
6. 在一次实验中,测得(x,y)的四组值分别是A(1,2)、B(2,3)、C(3,4)D(4,5),则y与x之间的回归直线方程为( A )
A. B. C. D.
7. 有下列关系:⑴人的年龄与其拥有的财富之间的关系;⑵曲线上的点与该点的坐标之间的关系;⑶苹果的产量与气候之间的关系;⑷森林中的同一树木,其横截面直径与高度之间的关系;⑸学生与其学号之间的关系。其中有相关关系的是__________。
答案: ⑴⑶⑷
8. 许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时,收集了美国50个州的成年人受过9年或更少教育的百分比()和收入低于官方规定的贫困线的人数占本州人数的百分比()的数据,建立的回归直线方程如下:。斜率的估计等于说明__________________,成年人受过9年或更少教育的百分比()和收入低于官方规定的贫困线的人数占本州人数的百分比()之间的相关系数__________________(填充“大于0“或”小于0“)。
答案: ⑴⑶⑷
9. 若施化肥量x与小麦产量y之间的回归直线方程为,当施化肥量为50kg时,预计小麦产量为__________。
解析:当时,。
答案:。
10. 在某种产品表面进行腐蚀性试验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:
时间
t(s)
5
10
15
20
30
40
50
60
70
90
120
深度
y(μm)
6
10
10
13
16
17
19
23
25
29
46
(1)画出散点图;
(2)求腐蚀深度y对腐蚀时间t的回归直线方程.
解:(1)散点图为
(2)经计算可得
b=≈0.3,
a=-b=19.45-0.3×46.36≈5.542.
故所求的线性回归方程为=0.3t+5.542.