温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
2023
学年
高考
数学
一轮
复习
第十一
统计
案例
变量
相关
关系
高效
演练
分层
突破
新人
第3讲 变量间的相关关系、统计案例
[基础题组练]
1.(2023年·陕西西安陕师大附中等八校联考)设两个变量x和y之间具有线性相关关系,它们的相关系数为r,y关于x的回归直线方程为=kx+b,则( )
A.k与r的符号相同 B.b与r的符号相同
C.k与r的符号相反 D.b与r的符号相反
解析:选A.因为相关系数r为正,表示正相关,回归直线方程上升,r为负,表示负相关,回归直线方程下降,所以k与r的符号相同.故选A.
2.在一次对性别与说谎是否相关的调查中,得到如下数据:
说谎
不说谎
总计
男
6
7
13
女
8
9
17
总计
14
16
30
根据表中数据,得到如下结论正确的一项是( )
A.在此次调查中有95%的把握认为是否说谎与性别有关
B.在此次调查中有99%的把握认为是否说谎与性别有关
C.在此次调查中有99.5%的把握认为是否说谎与性别有关
D.在此次调查中没有充分的证据显示说谎与性别有关
解析:选D.由已知得k=≈0.002<0.455,所以在犯错误的概率不超过50%的情况下,认为说谎与性别无关,也就是说,在此调查中没有充分的证据显示说谎与性别有关.
3.经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系,并得到y关于x的回归直线方程:=0.245x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加 万元.
解析:x变为x+1,=0.245(x+1)+0.321=0.245x+0.321+0.245,因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元.
答案:0.245
4.如图是一组数据(x,y)的散点图,经最小二乘估计公式计算,y与x之间的线性回归方程为=x+1,则= .
解析:由题图知==2,
==2.6,
将(2,2.6)代入=x+1中,解得=0.8.
答案:0.8
5.(2023年·陕西汉中略阳天津高级中学等12校联考)某市为了了解民众对开展创建文明城市工作以来的满意度,随机调查了40名群众,并将他们随机分成A,B两组,每组20人,A组群众给第一阶段的创文工作评分,B组群众给第二阶段的创文工作评分,根据两组群众的评分绘制了如图所示的茎叶图.
(1)根据茎叶图比较群众对两个阶段的创文工作满意度评分的平均值和集中数据(不要求计算出具体值,给出结论即可);
(2)完成下面的2×2列联表,并通过计算判断是否有99%的把握认为民众对两个阶段创文工作的满意度存在差异?
低于70分
不低于70分
总计
第一阶段
第二阶段
总计
参考公式:K2=,n=a+b+c+d.
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
解:(1)根据题中茎叶图可以看出,B组群众给第二阶段创文工作满意度评分的平均值高于A组群众给第一阶段创文工作满意度评分的平均值,且给分相对于A组更集中些.
(2)填写2×2列联表如下:
低于70分
不低于70分
总计
第一阶段
11
9
20
第二阶段
3
17
20
总计
14
26
40
所以K2=≈7.033>6.635.
所以有99%的把握认为民众对两个阶段创文工作的满意度存在差异.
6.某品牌手机厂商推出新款的旗舰机型,并在某地区跟踪调查得到这款手机上市时间(x个月)和市场占有率(y%)的几组相关对应数据:
x
1
2
3
4
5
y
0.02
0.05
0.1
0.15
0.18
(1)根据上表中的数据,用最小二乘法求出y关于x的线性回归方程;
(2)根据上述回归方程,分析该款旗舰机型市场占有率的变化趋势,并预测自上市起经过多少个月,该款旗舰机型市场占有率能超过0.5%(精准到月).
解:(1)根据表中数据,
计算=×(1+2+3+4+5)=3,
=×(0.02+0.05+0.1+0.15+0.18)=0.1,
所以=
=0.042,
所以=0.1-0.042×3=-0.026,
所以线性回归方程为=0.042x-0.026.
(2)由上面的回归方程可知,上市时间与市场占有率正相关,
即上市时间每增加1个月,市场占有率都增加0.042个百分点;
由=0.042x-0.026>0.5,解得x≥13;
预计上市13个月时,该款旗舰机型市场占有率能超过0.5%.
[综合题组练]
1.(2023年·兰州市诊断考试)“一本书,一碗面,一条河,一座桥”曾是兰州的城市名片,而现在“兰州马拉松”又成为了兰州的另一张名片,随着全民运动健康意识的提高,马拉松运动不仅在兰州,而且在全国各大城市逐渐兴起,参与马拉松训练与比赛的人数逐年增加.为此,某市对人们参加马拉松运动的情况进行了统计调查.其中一项调查是调查人员从参与马拉松运动的人中随机抽取200人,对其每周参与马拉松长跑训练的天数进行统计,得到以下统计表:
平均每周进行长跑训练天数
不大于2
3或4
不少于5
人数
30
130
40
若某人平均每周进行长跑训练天数不少于5,则称其为“热烈参与者”,否则称为“非热烈参与者”.
(1)经调查,该市约有2万人参与马拉松运动,试估计其中“热烈参与者”的人数;
(2)根据上表的数据,填写下列2×2列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下认为“热烈参与马拉松”与性别有关?
热烈参与者
非热烈参与者
总计
男
140
女
55
总计
附:K2=(n为样本容量)
P(K2≥k0)
0.500
0.400
0.250
0.150
0.100
0.050
0.025
0.010
0.005
0.001
k0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
解:(1)以200人中“热烈参与者”的频率作为概率,则该市“热烈参与者”的人数约为20 000×=4 000.
(2)2×2列联表为
热烈参与者
非热烈参与者
总计
男
35
105
140
女
5
55
60
总计
40
160
200
K2=≈7.292>6.635.
故能在犯错误的概率不超过0.01的前提下认为“热烈参与马拉松”与性别有关.
2.(2023年·长沙市统一模拟考试)某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:
月份
1
2
3
4
5
6
广告投入量/万元
2
4
6
8
10
12
收益/万元
14.21
20.31
31.8
31.18
37.83
44.67
他们用两种模型①y=bx+a,②y=aebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:
xiyi
x
7
30
1 464.24
364
(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由;
(2)残差绝对值大于2的数据被认为是异常数据,需要剔除.
①剔除异常数据后,求出(1)中所选模型的回归方程;
②广告投入量x=18时,(1)中所选模型收益的预报值是多少?
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线=x+的斜率和截距的最小二乘估计分别为:==,=-.
解:(1)应该选择模型①,因为模型①的残差点比较均匀地落在水平的带状区域中,且模型①的带状区域比模型②的带状区域窄,所以模型①的拟合精度高,回归方程的预报精度高.
(2)①剔除异常数据,即3月份的数据后,得
=×(7×6-6)=7.2,
=×(30×6-31.8)=29.64.
xiyi=1 464.24-6×31.8=1 273.44,
x=364-62=328.
====3,
=-=29.64-3×7.2=8.04.
所以y关于x的回归方程为=3x+8.04.
②把x=18代入(ⅰ)中所求回归方程得=3×18+8.04=62.04.
故预报值为62.04万元.
6