上好课
8.1.1
变量的相关关系教学课件-【上好课】高二数学同步备课系列人教A版2019选择性必修第三册
8.1
变量
相关
关系
教学
课件
上好
数学
同步
备课
系列
人教
2019
选择性
1,第8章 成对数据的统计分析,人教A版2019选择性必修第三册,8.1.1 变量的相关关系,1.结合实例,了解样本相关系数的统计含义.2.了解样本相关系数与标准化数据向量夹角的关系.3.结合实例,会通过样本相关系数比较多组成对样本数据的相关性,学习目标,在必修课程中,我们学习了单个变量的观察数据的直观表示和统计特征的刻画等知识与方法例如,用直方图描述样本数据的分布规律,用均值刻画样本数据的集中趋势,用方差刻画样本数据的离散程度等这些方法主要适用于通过样本认识单个变量的统计规律 在现实中,我们还经常需要了解两个或两个以上变量之间的关系例如,教育部门为掌握学生身体健康状况,需要了解身高变量和体重变量之间的关系;医疗卫生部门要制定预防青少年近视的措施,需要了解有哪些因素会影响视力,以及这些因素是如何影响视力的;商家要根据顾客的意见改进服务水平,希望了解哪些因素影响服务水平,以及这些因素是如何起作用的;等等 为此,我们需要进一步学习通过样本推断变量之间关系的知识和方法,环节一:创设情境,引入课题,本章的学习内容有成对数据的统计相关性、一元线性回归模型和列联表等,这些知识与方法在解决实际问题中非常有用可以发现,两个随机变量的相关性可以通过成对样本数据进行分析;利用一元线性回归模型可以研究变量之间的随机关系,进行预测;利用列联表可以检验两个随机变量的独立性 本章的学习对于提高我们解决实际问题的能力,提升数据分析、数学建模等素养都是非常有帮助的,“统计”,数据获取,数据记录,数据分析,抽样方法,统计图表,数据特征,变量关系,适用于单个变量的分析,变量A:,变量B:,分析逻辑,1,先分析是否相关,2,定性分析,4,量化分析是否合理,3,定量分析,我们知道,一个人的体重与他的身高有关系一般而言,个子高的人往往体重值较大,个子矮的人往往体重值较小但身高并不是决定体重的唯一因素,例如生活中的饮食习惯、体育锻炼、睡眠时间以及遗传因素等也是影响体重的重要因素像这样,两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系(correlation),环节二:观察分析,感知概念,两个变量具有相关关系的事例在现实中大量存在例如:1子女身高y与父亲身高x之间的关系一般来说,父亲的个子高,其子女的个子也会比较高;父亲个子矮,其子女的个子也会比较矮但影响子女身高的因素,除父亲身高外还有其他因素,例如母亲身高、饮食结构、体育锻炼等,因此父亲身高又不能完全决定子女身高2商品销售收入y与广告支出x之间的关系一般来说,广告支出越多,商品销售收入越高但广告支出并不是决定商品销售收入的唯一因素,商品销售收入还与商品质量、居民收入等因素有关3空气污染指数y与汽车保有量x之间的关系一般来说,汽车保有量增加,空气污染指数会上升但汽车保有量并不是造成空气污染的唯一因素,气象条件、工业生产排放、居民生活和取暖、垃圾焚烧等都是影响空气污染指数的因素4粮食亩产量y与施肥量x之间的关系在一定范围内,施肥量越大,粮食亩产就越高但施肥量并不是决定粮食亩产量的唯一因素,粮食亩产量还要受到土壤质量、降水量、田间管理水平等因素的影响,因为在相关关系中,变量y的值不能随变量x的值的确定而唯一确定,所以我们无法直接用函数去描述变量之间的这种关系对上述各例中两个变量之间的相关关系,我们往往会根据自己以往积累的经验作出推断“经验之中有规律”,经验的确可以为我们的决策提供一定的依据,但仅凭经验推断又有不足 例如,不同经验的人对同一情形可能会得出不同结论,不是所有的情形都有经验可循等因此,在研究两个变量之间的相关关系时,我们需要借助数据说话,即通过样本数据分析,从数据中提取信息,并构建适当的模型,再利用模型进行估计或推断,探究在对人体的脂肪含量和年龄之间关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据,如表8.1-1所示表中每个编号下的年龄和脂肪含量数据都是对同一个体的观测结果,它们构成了成对数据,根据以上数据,你能推断人体的脂肪含量与年龄之间存在怎样的关系吗?,环节三:抽象概括,形成概念,年龄/岁,为了更加直观地描述上述成对样本数据中脂肪含量与年龄之间的关系,类似于用直方图描述单个变量样本数据的分布特征,我们用图形展示成对样本数据的变化特征用横轴表示年龄,纵轴表示脂肪含量,则表8.1-1中每个编号下的成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了如图8.1-1所示的统计图 我们把这样的统计图叫做散点图(scatter plot),年龄/岁,观察图8.11可以发现,这些散点大致落在一条从左下角到右上角的直线附近,表明随年龄值的增加,相应的脂肪含量值呈现增高的趋势这样,由成对样本数据的分布规律,我们可以推断脂肪含量变量和年龄变量之间存在着相关关系,如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关(positive correlation);如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关(negative correlation),由图8.11,能够推断脂肪含量与年龄这两个变量正相关,环节四:辨析理解,深化概念,思考:(1)两个变量负相关时,成对样本数据的散点图有什么特点?(2)你能举出生活中两个变量正相关或负相关的一些例子吗?,散点图是描述成对数据之间关系的一种直观方法观察散点图8.1-1,从中我们不仅可以大致看出脂肪含量和年龄呈现正相关性,而且从整体上可以看出散点落在某条直线附近 一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关(linear correlation),年龄/岁,脂肪含量/%,观察散点图8.1-2,我们发现:图(1)中的散点落在某条曲线附近,而不是落在一条直线附近,说明这两个变量具有相关性,但不是线性相关;类似地,图(2)中的散点落在一条折线附近,这两个变量也具有相关性,但它们既不是正相关,也不是负相关;图(3)中的散点杂乱无章,无规律可言,看不出两个变量有什么相关性 一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关,环节五:课堂练习,巩固运用,两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.,1.相关关系,把成对样本数据用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.,2.散点图,3.正相关与负相关,一个变量随另一个变量的增加呈现减小的趋势.,正相关:,一个变量随另一个变量的增加呈现增加的趋势.,负相关:,环节六:归纳总结,反思提升,环节七:目标检测,作业布置,完成教材:第103页练习第3,4题.,练习 第95页,1举例说明什么叫相关关系相关关系与函数关系有什么区别?,例如,身高与脚长的关系,一般来说,身高较高的人脚长也会较长,但身高相同的人脚长末必相同;受教育程度和收人水平的关系,一般来说,受教育程度高的人收入也较高,但受教育程度相同的人收入未必相同 相关关系是指从总的变化趋势来看,变量之间存在着某种关系,但这种关系又不能用函数关系完全表达出来相关关系是不确定性的数量关系,对其中一个变量的每个取值,另一个变量可能有多个不同的取值;而函数关系是确定性的数量关系,对自变量的每个取值,因变量有唯一确定的值与之对应相同点:均是指两个变量的关系不同点:函数关系是一种确定的关系,因果关系;而相关关系是一种非确定性关系,也可能是伴随关系,2根据下面的散点图,判断图中的两个变量是否存在相关关系,负相关,非线性相关,不相关,正相关,3下表给出了一些地区的鸟的种类数与该地区的海拔高度的数据,鸟的种类数与海拔高度是否存在相关关系?如果是,那么这种相关关系有什么特点?,海拔高度/m,从散点图中散点的分布看,鸟的种类数与海拔高度正相关,鸟的种类数在海拔高度1000m以上的明显多于在海拔高度1000m以下的但从局部看,不管是在海拔高度1000m以上,还是在海拔高度1000m以下,鸟的种类数和海拔高度正相关都不明显,