2011-2020年高考数学真题分专题训练
专题32
概率和统计【理】教师版含解析
2011
2020
年高
数学
真题分
专题
训练
32
概率
统计
教师版
解析
专题专题 32概率和统计【理】概率和统计【理】十年大数据十年大数据*全景展示全景展示年年 份份题号题号考考 点点考考 查查 内内 容容2011理 2来源:Zxxk.Com概率古典概型的概率计算来源:学。科。网来源:学|科|网来源:学科网理 19频数分布表频数分布表,频率与概率2012理 15正态分布正态分布的应用理 19离散型随机变量及其分布列频数分布表,频率与概率,离散型随机变量及其分布列2013卷 1理 3抽样方法随机抽样方法的简单应用理 19离散型随机变量分布列、期望独立重复事件发生的概率,离散型随机变量分布列、期望卷 2理 14概率古典概型的概率计算理 19概率古典概型的概率计算2014卷 1理 5概率古典概型的概率计算理 18频率分布直方图,正态分布频率分布直方图,正态分布的 3原则,二项分布的期望卷 2理 5概率条件概率的计算理 19变量间的相关关系线性回归方程及其应用2015卷 1理 4概率独立重复事件概率的计算,互斥事件的概率理 19变量间的相关关系非线性拟合;线性回归方程卷 2理 3统计统计知识,柱形图理 18茎叶图茎叶图及其应用,互斥事件和独立事件的概率计算2016卷 1理 4概率几何概型概率的计算理 19离散型随机变量分布列、期望条形统计图及其应用,离散型随机变量分布列、期望卷 2理 10概率几何概型概率的计算理 19离散型随机变量的分布列、期望条件概率、离散型随机变量的分布列、期望卷 3理 4统计平均数的计算,统计图及其应用理 18变量间的相关关系线性相关与线性回归方程的求法与应用2017卷 1理 2概率古典概型的概率计算理 19离散性随机变量的分布列、期望离散性随机变量的分布列、期望,正态分布卷 2理 13离散性随机变量的分布列、期望离散性随机变量的分布列、期望,正态分布理 18频率分布直方图,统计案例频率分布直方图及其应用,统计案例及其应用卷 3理 3统计折线图统计图的应用理 18离散型随机变量的分布列、期望频数分布表,离散型随机变量的分布列、数学期望2018卷 1理 3统计扇形统计图及其应用理 10概率几何概型概率的计算,数学文化理 20离散性随机变量的数学期望n次独立重复试验恰好发生k次的概率及其最值问题,二项分布,离散性随机变量的数学期望卷 2理 8概率古典概型的概率计算理 18变量间的相关关系线性回归方程及其应用卷 3理 8二项分布二项分布分布列及期望理 18茎叶图和独立性检验茎叶图的应用,统计案例及其应用2019卷 1理 6概率古典概型的概率计算理 15概率独立重复事件的概率卷 2理 5统计中位数、平均数、方差、极差理 13概率利用统计数据进行概率的估计理 18概率独立事件、互斥事件的概率计算卷 3理 3统计抽样数据的统计理 17频率分布直方图频率分布直方图,用样本平均数估计总体的平均数2020卷 1理 5变量间的相关关系由散点图选择合适的回归模型理 19概率独立事件、互斥事件及独立重复事件概率的计算卷 2理 14排列与组合计数原理的应用,排列与组合应用题的解法理 18变量间的相关关系平均数的估计,相关系数的计算,抽样方法的选取卷 3理 3统计标准差的计算理 18独立性检验统计案例及其应用大数据分析大数据分析*预测高考预测高考考点出现频率2021 年预测考点 107 随机抽样23 次考 1 次2021 年在选择题和填空题中仍会重点考查各种统计图表、古典概型或几何概型及其概率计算,在解答题中重点考查频率分布直方图及其应用(与概率相结合),离散性随机变量的分布列与均值,二项分布及其应用,统计案例及其应用考点 108 用样本估计总体23 次考 10 次考点 109 变量间的相关关系23 次考 7 次考点 110 随机事件的概率、古典概型、几何概型23 次考 20 次考点111离散型随机变量及其分布列、均值与方差、正态分布、二项分布23 次考 14 次考点 112 独立性检验23 次考 4 次十年试题分类十年试题分类*探求规律探求规律考点考点 107随机抽样随机抽样1(2017 江苏理)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为 200,400,300,100 件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取 60 件进行检验,则应从丙种型号的产品中抽取件【答案】18【解析】应从丙种型号的产品中抽取30060181000件2(2014 广东理)为了解 1000 名学生的学习情况,采用系统抽样的方法,从中抽取容量为 40 的样本,则分段的间隔为()A50B40C25D20【答案】C【解析】由10002540,可得分段的间隔为 25故选 C3(2014 湖南理)对一个容器为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为123,p pp,则()A123pppB231pppC132pppD123ppp【答案】D【解析】根据抽样方法的概念可知,简单随机抽样、系统抽样和分层抽样三种抽样方法,每个个体被抽到的概率都是nN,故123ppp,故选 D4(2013 新课标 I 理理)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是()A简单随机抽样B按性别分层抽样C按学段分层抽样D系统抽样【答案】C【解析】因该地区小学、初中、高中三个学段学生的视力情况有较大差异,故最合理的抽样方法是按学段分层抽样,故选 C5(2014 湖北理)甲、乙两套设备生产的同类型产品共 4800 件,采用分层抽样的方法从中抽取一个容量为80 的样本进行质量检测若样本中有 50 件产品由甲设备生产,则乙设备生产的产品总数为件【答案】1800【解析】分层抽样中各层的抽样比相同,样本中甲设备生产的有 50 件,则乙设备生产的有 30件,在 4800 件产品中,甲、乙设备生产的产品总数比为 5:3,所以乙设备生产的产品总数为 1800 件6(2014 天津理)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为 300 的样本进行调查已知该校一年级、二年级、三年级、四年级的本科生人数之比为 4:5:5:6,则应从一年级本科生中抽取_名学生【答案】60【解析】应从一年级抽取4604556300=+名7(2012 江苏理)某学校高一、高二、高三年级的学生人数之比为334:,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为 50 的样本,则应从高二年级抽取名学生【答案】15【解析】由题意得高二年级的学生人数占该学校高中人数的103,利用分层抽样的有关知识得应从高二年级抽取 50103=15 名学生8(2012 浙江理)某个年级有男生 560 人,女生 420 人,用分层抽样的方法从该年级全体学生中抽取一个容量为 280 的样本,则此样本中男生人数为_【答案】160【解析】总体中男生与女生的比例为4:3,样本中男生人数为42801607考点考点 108用样本估计总体用样本估计总体9(2020 全国文 3)设一组样本数据12,nxxx的方差为0.01,则数据1210,10,10nxxx的方差为()A0.01B0.1C1D10【答案】C【解析】因为数据(1,2,)iaxb inL,的方差是数据(1,2,)ix inL,的方差的2a倍,所以所求数据方差为2100.01=1,故选:C10(2020 全国理 3)在一组样本数据中,1,2,3,4出现的频率分别为1234,pppp,且411iip,则下面四种情形中,对应样本的标准差最大的一组是()A14230.1,0.4ppppB14230.4,0.1ppppC14230.2,0.3ppppD14230.3,0.2pppp【答案】B【解析】对于 A 选项,该组数据的平均数为140.1230.42.5Ax,方差为222221 2.50.122.50.432.50.442.50.10.65As;对于 B 选项,该组数据的平均数为140.4230.12.5Bx,方差为222221 2.50.422.50.132.50.142.50.41.85Bs;对于 C 选项,该组数据的平均数为140.2230.32.5Cx,方差为222221 2.50.222.50.332.50.342.50.21.05Cs;对于 D 选项,该组数据的平均数为140.3230.22.5Dx,方差为222221 2.50.322.50.232.50.242.50.31.45Ds,因此 B 选项这一组的标准差最大,故选 B11(2020 天津 4)从一批零件中抽取 80 个,测量其直径(单位:mm),将所得数据分为 9 组:5.31,5.33),5.33,5.35),5.45,5.47,5.47,5.49,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间5.43,5.47)内的个数为()A10B18C20D36【答案】B【解析】由题意可得,直径落在区间5.43,5.47之间的零件频率为:6.255.000.020.225,则区间5.43,5.47内零件的个数为:800.22518,故选 B12(2019 全国 II 理 5)演讲比赛共有 9 位评委分别给出某选手的原始评分,评定该选手的成绩时,从 9 个原始评分中去掉 1 个最高分、1 个最低分,得到 7 个有效评分7 个有效评分与 9 个原始评分相比,不变的数字特征是A中位数B平均数C方差D极差【答案】A【解析】根据题意,从 9 个原始评分中去掉 1 个最高分、1 个最低分,得到 7 个有效评分,7 个有效评分与 9 个原始评分相比,最中间的一个数不变,即中位数不变故选 A13(2019 全国 II 理 13)我国高铁发展迅速,技术先进经统计,在经停某站的高铁列车中,有 10 个车次的正点率为 097,有 20 个车次的正点率为 098,有 10 个车次的正点率为 099,则经停该站高铁列车所有车次的平均正点率的估计值为_【答案】098【解析】经停该站高铁列车所有车次的平均正点率的估计值为:10 0.9720 0.98 10 0.990.981020 10 x14(2020 上海 8)已知有四个数1,2,a b,这四个数的中位数为 3,平均数为 4,则ab【答案】36【解析】设ab,则232a,解得:4a,1244ab,解得:9b,所以36ab 故答案为:36。15(2020 江苏 3)已知一组数据4,2,32,5,6aa的平均数为4,则a的值是【答案】2【解析】由题意得4235645aa,解得2a 16(2019 江苏 5)已知一组数据 6,7,8,8,9,10,则该组数据的方差是【答案】53【解析】一组数据 6,7,8,8,9,10 的平均数为1(67889 10)86x ,所以该组数据的方差为222222215(68)(78)(88)(88)(98)(108)63s 17(2020 新高考山东海南 9)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续 11天复工复产指数折线图,下列说法正确的是()A这 11 天复工指数和复产指数均逐日增加B这 11 天期间,复产指数增量大于复工指数的增量C第 3 天至第 11 天复工复产指数均超过 80%D第 9 天至第 11 天复产指数增量大于复工指数的增量【答案】CD【解析】由图可知,第 1 天到第 2 天复工指数减少,第 7 天到第 8 天复工指数减少,第 10 天到第 11 复工指数减少,第 8 天到第 9 天复产指数减少,故 A 错误;由图可知,第一天的复产指标与复工指标的差大于第 11 天的复产指标与复工指标的差,所以这 11 天期间,复产指数增量小于复工指数的增量,故 B错误;由图可知,第 3 天至第 11 天复工复产指数均超过 80%,故 C 正确;由图可知,第 9 天至第 11 天复产指数增量大于复工指数的增量,故 D 正确18(2018 全国理)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番,为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:建设前经济收入构成比例建设后经济收入构成比例则下面结论中不正确的是A新农村建设后,种植收入减少B新农村建设后,其他收入增加了一倍以上C新农村建设后,养殖收入增加了一倍D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【答案】A【解析】通解 设建设前经济收入为a,则建设后经济收入为2a,则由饼图可得建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的故选 A优解因为0.60.37 2,所以新农村建设后,种植收入增加,而不是减少,所以 A 是错误的故选 A19(2017 新课标理)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了 2014 年 1 月至 2016 年 12 月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图根据该折线图,下列结论错误的是A月接待游客量逐月增加B年接待游客量逐年增加C各年的月接待游客量高峰期大致在 7,8 月份D各年 1 月至 6 月的月接待游客量相对 7 月至 12 月,波动性更小,变化比较平稳【答案】A【解析】由折线图,7 月份后月接待游客量减少,A 错误,故选 A20(2016 年山东理)某高校调查了 200 名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30根据直方图,这 200 名学生中每周的自习时间不少于 225 小时的人数是A56B60C120D140【答案】D【解析】由频率分布直方图可知,这 200 名学生每周的自习时间不少于 225 小时的频率为(016+008+004)25=07,故这 200 名学生中每周的自习时间不少于 225 小时的人数为 20007=140故选 D21(2016 年全国 III 理)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图 图中 A 点表示十月的平均最高气温约为 15,B 点表示四月的平均最低气温约为 5 下面叙述不正确的是A各月的平均最低气温都在 0以上B七月的平均温差比一月的平均温差大C三月和十一月的平均最高气温基本相同D平均气温高于 20的月份有 5 个【答案】D【解析】由图可知 0在虚线框内,所以各月的平均最低气温都在 0以上,A 正确;由图可知七月的平均温差比一月的平均温差大,B 正确;由图可知三月和十一月的平均最高气温都约为 10,基本相同,C 正确;由图可知平均最高气温高于 20的月份不是 5 个,D 不正确,故选 D22(2015 陕西理)某中学初中部共有 110 名教师,高中部共有 150 名教师,其性别比例如图所示,则该校女教师的人数为A167B137C123D93【答案】C【解析】由扇形统计图可得,该校女教师人数为110 70 150(1 60%)13723(2015 新课标 I 理理 I 理)根据下面给出的 2004 年至 2013 年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论不正确的是A逐年比较,2008 年减少二氧化硫排放量的效果最显著B2007 年我国治理二氧化硫排放显现成效C2006 年以来我国二氧化硫年排放量呈减少趋势D2006 年以来我国二氧化硫年排放量与年份正相关【答案】D【解析】根据柱形图易得选项 A,B,C 正确,2006 年以来我国二氧化碳年排放量与年份负相关,选项 D 错误24(2015 安徽理)若样本数据1x,2x,10 x的标准差为8,则数据121x,221x,1021x 的标准差为A8B15C16D【答案】C【解析】设样本数据1x,2x,10 x的标准差为DX,则8DX,即方差64DX,而数据121x,221x,1021x 的方差22(21)2264DXDX,所以其标准差为226416,故选 C25(2014 广东理)已知某地区中小学生人数和近视情况分别如图 1 和图 2 所示,为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取 2的学生进行调查,则样本容量和抽取的高中生近视人数分别是A200,20B100,20C200,10D100,10【答案】A【解析】所抽人数为(350020004500)2%200,近视人数分别为小学生3500 10%350,初中生4500 30%1350,高中生2000 50%1000,抽取的高中生近视人数为1000 2%20,故选 A26(2013 福建理)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分为 6 组:40,50),50,60),60,70),70,80),80,90),90,100加以统计,得到如图所示的频率分布直方图,已知高一年级共有学生 600 名,据此估计,该模块测试成绩不少于 60 分的学生人数为()A588B480C450D120【答案】B【解析】由图知道 60 分以上人员的频率为后 4 项频率的和,由图知道(0.030.0250.0150.01)*100.8P,故分数在 60 以上的人数为 60008=480 人27(2013 山东理)将某选手的 9 个得分去掉 1 个最高分,去掉 1 个最低分,7 个剩余分数的平均分为 91,现场做的 9 个分数的茎叶图后来有一个数据模糊,无法辨认,在图中以x表示:则 7 个剩余分数的方差为()A1169B367C36D6 77【答案】B【解析】由图可知去掉的两个数是 87,99,所以8790 291 294 9091 7x,4x 22222136(8791)(9091)2(91 91)2(9491)277s 28(2012 陕西理)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()A46,45,56B46,45,53C47,45,56D45,47,53【答案】A【解析】由概念知中位数是中间两数的平均数,即45+47=462,众数是 45,极差为 68-12=56,故选 A29(2018 江苏理)已知 5 位裁判给某运动员打出的分数的茎叶图如图所示,那么这 5 位裁判打出的分数的平均数为【答案】90【解析】由茎叶图可得分数的平均数为89899091 9190529(2015 湖南理)在一次马拉松比赛中,35 名运动员的成绩(单位:分钟)的茎叶图如图所示若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取 7 人,则其中成绩在区间139,151上的运动员人数是【答案】4【解析】由茎叶图可知,在区间151,139的人数为20,再由系统抽样的性质可知人数为435720人30(2014 江苏理)为了了解一片经济的生长情况,随机抽测了其中 60 株树木的底部周长(单位:cm),所得数据均在区间80,130上,其频率分布直方图如图所示,则在抽测的 60 株树木中,有株树木的底部周长小于 100cm【答案】24【解析】由频率分布直方图可得树木底部周长小于 100cm 的频率是(0025+0015)10=04,又样本容量是 60,所以频数是 0460=2431(2013 辽宁理)为了考察某校各班参加课外书法小组的人数,在全校随机抽取 5 个班级,把每个班级参加该小组的人数作为样本数据已知样本平均数为 7,样本方差为 4,且样本数据互不相同,则样本数据中的最大值为【答案】10【解析】设五个班级的数据分别为abcde由平均数方差的公式得75abcde,22222(7)(7)(7)(7)(7)45abcde,显然各个括号为整数设7,7,7,7,7abcde分别为,p q r s t,(,)p q r s tZ,则222220(1)20(2)pqrstpqrst 设2222()()()()()f xxpxqxrxs=2222242()()xpqrs xpqrs=224220 xtxt,因为数据互不相同,分析()f x的构成,得()0f x 恒成立,因此判别式0,得4t,所以3t,即10e 32(2012 山东理)右图是根据部分城市某年 6 月份的平均气温(单位:)数据得到的样本频率分布直方图,其中平均气温的范围是 20 5,26 5,样本数据的分组为20.5,21.5),21.5,22.5),22.5,23.5),23.5,24.5),24.5,25.5),25.5,26.5已知样本中平均气温低于 225的城市个数为 11,则样本中平均气温不低于255的城市个数为【答案】9【解析】最左边两个矩形面积之和为 0101+0121022,总城市数为 1102250,最右面矩形面积为 0181018,50018933(2019 全国 III 理 17)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将 200 只小鼠随机分成 A、B 两组,每组 100 只,其中 A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每组小鼠给服的溶液体积相同、摩尔浓度相同经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比根据试验数据分别得到如下直方图:记 C 为事件:“乙离子残留在体内的百分比不低于 55”,根据直方图得到 P(C)的估计值为 070(1)求乙离子残留百分比直方图中 a,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)【解析】(1)由已知得0.700.200.15a,故0.35a,b=1005015070=010(2)甲离子残留百分比的平均值的估计值为2015+3020+4030+5020+6010+7005=405乙离子残留百分比的平均值的估计值为3005+4010+5015+6035+7020+8015=60034(2016 年四川理)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨)、一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费为了了解居民用水情况,通过抽样,获得了某年 100 位居民每人的月均用水量(单位:吨),将数据按照0,05),05,1),4,45)分成 9 组,制成了如图所示的频率分布直方图(I)求直方图中 a 的值;(II)设该市有 30 万居民,估计全市居民中月均用水量不低于 3 吨的人数,并说明理由;(III)若该市政府希望使 85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由【解析】(I)由概率统计相关知识,各组频率之和的值为1频率=(频率/组距)*组距,0.50.080.160.40.520.120.080.0421a,得0.3a(II)由图,不低于3吨人数所占百分比为0.50.120.080.04=12%,全市月均用水量不低于3吨的人数为:30 12%=3.6(万)()由图可知,月均用水量小于25吨的居民人数所占百分比为:0.50.080.160.30.40.520.73,即73%的居民月均用水量小于25吨,同理,88%的居民月均用水量小于3吨,故2.53x,假设月均用水量平均分布,则85%73%0.52.50.52.90.3x(吨)注:本次估计默认组间是平均分布,与实际可能会产生一定误差35(2015 广东理)某工厂 36 名工人年龄数据如下表工人编号年龄工人编号年龄工人编号年龄工人编号年龄140244340441533640745842943103611311238133914431545163917381836192720432141223723342442253726442742283429393043313832423353343745493639(1)用系统抽样法从 36 名工人中抽取容量为 9 的样本,且在第一分段里用随机抽样法抽到的年龄数据为 44,列出样本的年龄数据;(2)计算(1)中样本的均值x和方差2s;(3)36 名工人中年龄在xs和xs之间有多少人?所占的百分比是多少(精确到0.01%)?【解析】(1)由系统抽样可知,36 人分成 9 组,每组 4 人,其中第一组的工人年龄为 44,所以其编号为 2,故所有样本数据的编号为42n,1,2,9n 其数据为:44,40,36,37,44,43,37(2)444037409x由方差公式,22221100(4440)(4040)(3740)99s(3)因为21009s,所以10(3,4)3s 所以 36 名工人中年龄在xs和xs之间的人数等于在区间37,43内的人数,即 40,40,41,39,共 23 人所以 36 名工人中年龄在xs和xs之间的人数所占的百分比为2363.89%3636(2013 年新课标 I 理)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0612271528182223323525261227152930312324服用B药的20位患者日平均增加的睡眠时间:3217190809241226131416051806211125122705(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?【解析】(1)设 A 药观测数据的平均数为x,B 药观测数据的平均数为y,又观测结果可得120 x(0 6+1 2+1 2+1 5+1 5+1 8+2 2+2 3+2 3+2 4+2 5+2 6+2 7+2 7+2 8+3 0+3 1+3 2+3 5)=2 3,1(0.50.50.60.80.9 1.1 1.2 1.2201.3 1.4 1.6 1.7 1.8 1.92.12.42.52.62.73.2)1.6y 由以上计算结果可得xy,因此可看出 A 药的疗效更好(2)由观测结果可绘制如下茎叶图:A 药B 药605 5 6 8 98 5 5 2 211 2 2 3 4 6 7 8 99 8 7 7 6 5 4 3 3 221 4 5 6 75 2 1 032从以上茎叶图可以看出,A 药疗效的试验结果有的叶集中在茎 23 上,而 B 药疗效的试验结果有710的叶集中在茎 0,1 上,由此可看出 A 药的疗效更好37(2012 广东理)某校 100 名学生期中考试语文成绩的频率分布直方图如图 4 所示,其中成绩分组区间是:50,60),60,70),70,80),80,90),90,100(1)求图中a的值;(2)根据频率分布直方图,估计这 100 名学生语文成绩的平均分;(3)若这 100 名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在50,90)之外的人数分数段60,5070,6080,7090,80 x:y1:12:13:44:5【解析】(1)(20.020.030.04)1010.005aa(2)平均分为55 0.0565 0.475 0.3 85 0.295 0.0573(3)数学成绩在50,90)内的人数为145(0.0050.040.030.02)10 10090234人数学成绩在50,90)外的人数为1009010人答:(1)0.005a(2)这 100 名学生语文成绩的平均分为73(3)数学成绩在50,90)外的人数为10人考点考点 109变量间的相关关系变量间的相关关系38(2020 全国文理 5)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:C)的关系,在 20 个不同的温度条件下进行种子发芽实验,由实验数据,1,2,20iixyi 得到下面的散点图:由此散点图,在10 C至40 C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()AyabxB2yabxCexyabDlnyabx【答案】D【解析】由散点图分布可知,散点图分布在一个对数函数的图像附近,因此,最适合作为发芽率y和温度x的回归方程类型的是lnyabx,故选 D39(2017 山东理)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10 名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为ybxa已知101225iix,1011600iiy,4b 该班某学生的脚长为 24,据此估计其身高为A160B163C166D170【答案】C【解析】因为22.5x,160y,所以1604 22.570a ,4 2470166y,故选C40(2015 福建理)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区 5 户家庭,得到如下统计数据表:收入x(万元)8286100113119支出y(万元)6275808598根据上表可得回归本线方程ybxa,其中0.76,baybx,据此估计,该社区一户收入为 15 万元家庭年支出为A114 万元B118 万元C120 万元D122 万元【答案】B【解析】10.0 x,8.0y,0.76b,80.76 100.4a ,回归方程为0.760.4yx=+,把15x=代入上式得,0.76 15 0.411.8y=+=(万元),故选 B41(2014 重庆理)已知变量x与y正相关,且由观测数据算得样本的平均数3x,3.5y,则由该观测数据算得的线性回归方程可能为A0.42.3yxB22.4yxC29.5yx D0.34.4yx【答案】A【解析】由题意可知,相应的回归直线的斜率应为正,排除 C、D且直线必过点(3,3.5),代入A、B 得 A 正确42(2014 湖北理)根据如下样本数据x345678y40250.5052.03.0得到的回归方程为 ybxa,则A0a,0b B0a,0b C0a,0b D0a,0b【答案】A【解析】画出散点图知0,0ba,故选 A43(2012 新课标理)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,n)都在直线112yx上,则这组样本数据的样本相关系数为A1B0C12D1【答案】D【解析】因为所有的点都在直线上,这组样本数据完全正相关,故其相关系数为 1,故故选 D44(2014 江西理)某人研究中学生的性别与成绩、视力、智商、阅读量这 4 个变量之间的关系,随机抽查52 名中学生,得到统计数据如表 1 至表 4,则与性别有关联的可能性最大的变量是【答案】D【解析】因为222152(6 22 14 10)52 816 36 32 2016 36 32 20,222252(4 20 16 12)52 11216 36 32 2016 36 32 20,222352(8 24 12 8)52 9616 36 32 2016 36 32 20,222452(14 306 2)52 40816 36 32 2016 36 32 20,则有22224231,所以阅读量与性别关联的可能性最大,故选 D45(2012 湖南理)设某大学的女生体重 y(单位:kg)与身高 x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,n),用最小二乘法建立的回归方程为y=085x8571,则下列结论中不正确的是Ay 与 x 具有正的线性相关关系B回归直线过样本点的中心(x,y)C若该大学某女生身高增加 1cm,则其体重约增加 085kgD若该大学某女生身高为 170cm,则可断定其体重必为 5879kg【答案】D【解析】由回归方程为y=085x8571 知y随x的增大而增大,所以 y 与 x 具有正的线性相关关系,由最小二乘法建立的回归方程得过程知()ybxabxybx aybx,所以回归直线过样本点的中心(x,y),利用回归方程可以预测估计总体,所以 D 不正确46(2011 山东理)某产品的广告费用 x 与销售额 y 的统计数据如下表广告费用 x(万元)4235销售额 y(万元)49263954根据上表可得回归方程ybxa中的b为 94,据此模型预报广告费用为 6 万元时销售额为A636 万元B655 万元C677 万元D720 万元【答案】B【解析】样本中心点是(35,42),则429.4 3.59.1aybx,所以回归方程是9.49.1yx,把6x 代入得65.5y 47(2018 全国理)下图是某地区 2000 年至 2016 年环境基础设施投资额y(单位:亿元)的折线图为了预测该地区 2018 年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型根据 2000 年至 2016 年的数据(时间变量t的值依次为1 217,)建立模型:30.4 13.5 yt;根据 2010 年至 2016年的数据(时间变量t的值依次为1 27,)建立模型:99 17.5yt(1)分别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由【解析】(1)利用模型,该地区 2018 年的环境基础设施投资额的预测值为30.4 13.5 19226.1y (亿元)利用模型,该地区 2018 年的环境基础设施投资额的预测值为99 17.5 9256.5y(亿元)(2)利用模型得到的预测值更可靠理由如下:()从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散布在直线30.4 13.5yt 上下这说明利用 2000 年至 2016 年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势2010年相对 2009 年的环境基础设施投资额有明显增加,2010 年至 2016 年的数据对应的点位于一条直线的附近,这说明从 2010 年开始环境基础设施投资额的变化规律呈线性增长趋势,利用 2010 年至 2016 年的数据建立的线性模型99 17.5yt可以较好地描述 2010 年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠()从计算结果看,相对于 2016 年的环境基础设施投资额 220 亿元,由模型得到的预测值 2261 亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理说明利用模型得到的预测值更可靠以上给出了 2 种理由,考生答出其中任意一种或其他合理理由均可得分48(2016 新课标理 II)下图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨)的折线图()由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;()建立y关于t的回归方程(系数精确到 001),预测 2016 年我国生活垃圾无害化处理量附注:参考数据:719.32iiy,7140.17iiit y,721()0.55iiyy,72646参考公式:相关系数12211()()()(yy)niiinniiiittyyrtt,回归方程yabt中斜率和截距的最小二乘估计公式分别为:121()()()niiiniittyybtt,=.a ybt【解析】()由折线图这数据和附注中参考数据得4t,28)(712iitt,55.0)(712iiyy,777111()()40.174 9.322.89iiiiiiiittyyt yty,99.0646.2255.089.2r因为y与t的相关系数近似为 099,说明y与t的线性相关相当高,从而可以用线性回归模型拟合y与t的关系()由331.1732.9y及()得71721()()2.890.10328()iiiiittyybtt,92.04103.0331.