_11
变量
相关
关系
统计
案例
北京曲一线图书策划有限公司 2024版《5年高考3年模拟》A版
11.5 变量间的相关关系、统计案例
基础篇
考点一 变量间的相关关系
1.(2023届广东东莞四中月考,5)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )
A.r2<r4<0<r3<r1 B.r2<r4<0<r1<r3
C.r4<r2<0<r3<r1 D.r4<r2<0<r1<r3
答案 A
2.(多选)(2023届山东潍坊五县联考,10)下列说法正确的是( )
A.经验回归直线y^=b^x+a^至少经过样本点数据中的一个点
B.若经验回归直线方程为y^=1.1x-5,则当x每增大一个单位时,y^增大1.1个单位
C.设两个变量x,y之间的线性相关系数为r,则|r|=1的充要条件是成对数据构成的点都在经验回归直线上
D.在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好
答案 CD
3.(2020课标Ⅰ,文5,理5,5分)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A.y=a+bx B.y=a+bx2
C.y=a+bex D.y=a+bln x
答案 D
4.(2017山东理,5,5分)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为y^=b^x+a^.已知i=110xi=225,i=110yi=1 600,b^=4.该班某学生的脚长为24,据此估计其身高为( )
A.160 B.163 C.166 D.170
答案 C
5.(多选)(2022山东济宁一中开学考试,10)给出以下四个说法,其中正确的说法是( )
A.如果由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到经验回归方程y^=b^x+a^,那么经验回归直线至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个
B.在回归分析中,用决定系数R2来比较两个模型拟合效果,R2越大,表示残差平方和越小,即模型的拟合效果越好
C.在经验回归方程y^=-0.5x+0.7中,当解释变量x每增加一个单位时,响应变量y^平均增加0.5个单位
D.若变量y和x之间的相关系数为r=-0.987 2,则变量y和x之间的负线性相关很强
答案 BD
6.(2022全国乙,理19,文19,12分)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i
1 2 3 4 5 6 7 8 9 10
总和
根部横截
面积xi
0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.070.06
0.6
材积量yi
0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.420.40
3.9
并计算得i=110xi2=0.038,i=110yi2=1.615 8,i=110xiyi=0.247 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数i=1n(xi−x)(yi−y)i=1n(xi−x)2i=1n(yi−y)2ri=1n(xi−x)(yi−y)i=1n(xi−x)2i=1n(yi−y)2=,
1.896≈1.377.
解析 (1)估计该林区这种树木平均一棵的根部横截面积为x=0.610=0.06(m2),
平均一棵的材积量为y=3.910=0.39(m3).
(2)样本相关系数i=110(xi−x)(yi−y)i=110(xi−x)2i=110(yi−y)2ri=110(xi−x)(yi−y)i=110(xi−x)2i=110(yi−y)2=
=i=110xiyi−10xy(i=110xi2−10x2)(i=110yi2−10y2)
=0.247 4−10×0.06×0.39(0.038−10×0.062)(1.615 8−10×0.392)
=0.013 40.002×0.094 8=0.013 40.011.896≈0.013 40.013 77≈0.97.
即该林区这种树木的根部横截面积与材积量的样本相关系数约为0.97.
(3)设这种树木的根部横截总面积为X m2,总材积量为Y m3,则XY=xy,则Y=X·yx=186×0.390.06=1 209,
所以该林区这种树木的总材积量的估计值为1 209 m3.
7.(2020课标Ⅱ,文18,理18,12分)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得i=120xi=60,i=120yi=1 200,i=120(xi-x)2=80,i=120(yi-y)2=9 000,i=120(xi-x)(yi-y)=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=i=1n(xi−x)(yi−y)i=1n(xi−x)2i=1n(yi−y)2,2≈1.414.
解析 (1)由已知得样本平均数y=120i=120yi=60,从而该地区这种野生动物数量的估计值为60×200=12 000.
(2)样本(xi,yi)(i=1,2,…,20)的相关系数
i=120(xi−x)(yi−y)i=120(xi−x)2i=120(yi−y)2=ri=120(xi−x)(yi−y)i=120(xi−x)2i=120(yi−y)2==80080×9 000=223≈0.94.
(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机抽样.
理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关关系.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
考点二 独立性检验
1.(2021全国甲,文17,理17,12分)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品
二级品
合计
甲机床
150
50
200
乙机床
120
80
200
合计
270
130
400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?
附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
.
解析 (1)因为甲机床生产的200件产品中有150件一级品,所以甲机床生产的产品中一级品的频率为150200=34,因为乙机床生产的200件产品中有120件一级品,所以乙机床生产的产品中一级品的频率为120200=35.
(2)根据2×2列联表中的数据,得K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)
=400×(150×80−120×50)2270×130×200×200=40039≈10.256,因为10.256>6.635,所以有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异.
2.(2022全国甲文,17,12分)甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
准点班次数
未准点班次数
A
240
20
B
210
30
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?
附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),
P(K2≥k)
0.100
0.050
0.010
k
2.706
3.841
6.635
解析 (1)由题意可得A公司长途客车准点的概率P1=240260=1213,B公司长途客车准点的概率P2=210240=78.
(2)因为K2=500×(240×30−20×210)2450×50×240×260≈3.205>2.706,
所以有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.
3.(2020新高考Ⅰ,19,12分)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
SO2
PM2.5
[0,50]
(50,150]
(150,475]
[0,35]
32
18
4
(35,75]
6
8
12
(75,115]
3
7
10
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
(2)根据所给数据,完成下面的2×2列联表:
SO2
PM2.5
[0,150]
(150,475]
[0,75]
(75,115]
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.
附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
.
解析 (1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为64100=0.64.
(2)根据抽查数据,可得2×2列联表:
SO2
PM2.5
[0,150]
(150,475]
[0,75]
64
16
(75,115]
10
10
(3)根据(2)的列联表得
K2=100×(64×10−16×10)280×20×74×26≈7.484.
由于7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.
4.(2023届长沙一中月考二,20)某芯片制造企业使用新技术对某款芯片进行试生产.在试产初期,该款芯片生产有四道工序,前三道工序的生产互不影响,第四道是检测评估工序,包括智能自动检测与人工抽检.
(1)在试产初期,该款芯片的批次M生产前三道工序的次品率分别为P1=160,P2=159,P3=158.
①求批次M芯片的次品率PM;
②第四道工序中智能自动检测为次品的芯片会被自动淘汰,合格的芯片进入流水线并由工人进行抽查检验.已知批次M的芯片智能自动检测显示合格率为98%,求工人在流水线进行人工抽检时,抽检一个芯片恰为合格品的概率.
(2)该企业改进生产工艺后生产了批次N的芯片.某手机生产厂商获得批次M与批次N的芯片,并在某款新型手机上使用.现对使用这款手机的用户回访,对开机速度进行满意度调查.据统计,回访的100名用户中,安装批次M的有40人,其中对开机速度满意的有30人;安装批次N的有60人,其中对开机速度满意的有58人.依据α=0.005的独立性检验,能否认为芯片批次与用户对开机速度满意度有关?
附:χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)
α
0.10
0.05
0.010
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
解析 (1)①批次M芯片的次品率为
PM=1-(1-P1)(1-P2)(1-P3)=1-5960×5859×5758=120.
②设批次M的芯片智能自动检测合格为事件A,人工抽检合格为事件B,
由已知得P(A)=98100,P(AB)=1-PM=1-120=1920,
则工人在流水线进行人工抽检时,抽检一个芯片恰为合格品为事件B|A,P(B|A)=P(AB)P(A)=1920×10098=9598.
(2)零假设为H0:芯片批次与用户对开机速度满意度无关.由数据可建立2×2列联表如下:(单位:人)
开机速度满意度
芯片批次
合计
M
N
不满意
10
2
12
满意
30
58
88
合计
40
60
100
根据列联表得
χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=100×(10×58−2×30)240×60×12×88≈10.67>7.879.
因此,依据α=0.005的独立性检验,我们推断H0不成立,即能认为芯片批次与用户对开机速度满意度有关.此推断犯错误的概率不大于0.005.
5.(2020课标Ⅲ,18,12分)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次
空气质量等级
[0,
200]
(200,
400]
(400,
600]
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
人次≤400
人次>400
空气质量好
空气质量不好
附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
.
解析 (1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如表:
空气质量等级
1
2
3
4
概率的估计值
0.43
0.27
0.21
0.09
(2)一天中到该公园锻炼的平均人次的估计值为1100×(100×20+300×35+500×45)=350.
(3)根据所给数据,可得2×2列联表:
人次≤400
人次>400
空气质量好
33
37
空气质量不好
22
8
根据列联表得K2=100×(33×8−22×37)255×45×70×30≈5.820.
由于5.820>3.841,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
6.(2023届河北邯郸摸底,19)暑假期间,某学校建议学生保持晨读的习惯,开学后,该校对高二、高三随机抽取200名学生(该学校学生总数较多),调查日均晨读时间,数据如表:
日均晨读
时间/分钟
[0,
10)
[10,
20)
[20,
30)
[30,
40)
[40,
50)
[50,
60]
人数
5
10
25
50
50
60
将学生日均晨读时间在[30,60]上的学生评价为“晨读合格”.
(1) 请根据上述表格中的统计数据填写下面2×2列联表,依据α=0.05的独立性检验,能否认为“晨读合格”与年级有关?
晨读不合格
晨读合格
合计
高二
高三
15
100
合计
(2)将上述调查所得到的频率视为概率来估计全校的情况,现在从该校所有学生中,随机抽取2名学生,记所抽取的2人中晨读合格的人数为随机变量ξ,求ξ的分布列和数学期望.
参考公式:χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
临界值表:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
解析 (1)列联表如下:
晨读不合格
晨读合格
合计
高二
25
75
100
高三
15
85
100
合计
40
160
200
χ2=200×(25×85−15×75)2100×100×40×160=3.125<3.841=x0.05,
所以依据α=0.05的独立性检验,不能认为“晨读合格”与年级有关.
(2)由题意,知学生晨读合格的概率为160200=45,易知ξ~B2,45,
所以Pξ=0=C20·450·152=125,Pξ=1=C21·451·151=825,Pξ=2=C22·452·150=1625,ξ的分布列为
ξ
0
1
2
P
125
825
1625
所以E(ξ)=0×125+1×825+2×1625=85.
综合篇
考法一 经验回归方程的求解与应用
1. (多选)(2022重庆秀山高级中学月考,10)已知变量x,y之间的经验回归方程为y^=
-0.7x+10.3,且变量x,y之间的一组相关数据如表所示,则下列说法正确的是( )
x
6
8
10
12
y
6
m
3
2
A.变量x,y之间成负相关关系
B.当x=20时,y^=-3.7
C.m=4
D.该经验回归直线必过点(9,4)
答案 ABD
2.(2022山东潍坊摸底,14)已知关于x,y的一组数据:
x
1
m
3
4
5
y
0.5
0.6
n
1.4
1.5
根据表中数据得到的经验回归方程为y^=0.28x+0.16,则n-0.28m的值为 .
答案 0.44
3.(2023届广东普宁华美实验学校月考,19)研究显示,越来越多的上班族下班后通过慢跑强身健体,慢跑属于一种有氧运动,可以消耗人体大量热量,坚持慢跑可以促进新陈代谢,增加肺活量以及增强心脏功能,提升人体免疫力,因此深受青年人喜爱.下图统计了小明这100天每天慢跑的时间情况(单位:分钟).
(1)求m的值.
(2)小明的同事小强本月前7次慢跑的时间情况如表.由散点图可知,小强的慢跑次数x和慢跑时间y(单位:分钟)之间成线性相关.
次数x
1
2
3
4
5
6
7
慢跑时间y(单位:分钟)
15
18
27
23
20
29
36
①求y关于x的经验回归方程y^=b^x+a^,其中b^,a^使用分数形式表示;
②根据①中的运算结果预测小强第9次的慢跑时间是否会超过小明这100天慢跑的平均时间.
参考公式:在经验回归方程y^=b^x+a^中,b^=i=1n(xi−x)(yi−y)i=1n(xi−x)2,a^=y−b^x.
解析 (1)依题意,得(0.005+0.012+m+0.034+0.015+0.003)×10=1,解得m=0.031.
(2)①依题意,知x=1+2+3+4+5+6+77=4,y=15+18+27+23+20+29+367=24,
i=17(xi-x)(yi-y)=(-3)×(-9)+(-2)×(-6)+(-1)×3+1×(-4)+2×5+3×12=78,
i=17(xi−x)2=(-3)2+(-2)2+(-1)2+12+22+32=28,
则b^=i=17(xi−x)(yi−y)i=17(xi−x)2=3914,a^=y−b^x=24−3914×4=907,故所求经验回归方程为y^=3914x+907.
②小明这100天慢跑的平均时间为
5×0.05+15×0.12+25×0.31+35×0.34+45×0.15+55×0.03=30.1,
将x=9代入y^=3914x+907中,得y^=3914×9+907≈37.93>30.1,故可以预测小强第9次的慢跑时间会超过小明这100天慢跑的平均时间.
4.(2023届浙江嘉兴一中期中,20)根据中国海洋生态环境状况公报,从2017年到2021年全国直排海污染源中各年份的氨氮总量y(单位:千吨)与年份的散点图如图.
记年份代码为x(x=1,2,3,4,5),t=1x,对数据处理后得:
y
t
i=15ti2
i=15yi2
i=15xiyi
i=15tiyi
6
0.5
1.5
210
76
17
(1)根据散点图判断,模型①y=bx+a与模型②y=dx+c哪一个适宜作为y关于x的回归方程?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果,建立y关于x的回归方程,并预测2022年全国直排海污染源中的氨氮总量(计算结果精确到整数).
参考公式:回归方程y^=v^x+u^中斜率和截距的最小二乘估计公式分别为v^=i=1n(xi−x)(yi−y)i=1n(xi−x)2=i=1nxiyi−nxyi=1nxi2−nx2,u^=y−v^x.
解析 (1)根据散点图的趋势,可知模型②适宜作为y关于x的回归方程.
(2)因为d^=i=15tiyi−5t·yi=15ti2−5t2=8,且c^=y−d^t=2,
所以y关于t的回归方程为y^=8t+2,即y关于x的回归方程为y^=8x+2,
2022年对应的年份代码为x=6,所以y^≈3,故预计2022年全国直排海污染源中的氨氮总量为3千吨.
5.(2023届广州仲元中学月考,20)随着时代的不断发展,社会对高素质人才的需求不断扩大,我国本科毕业生中考研人数也不断攀升,2020年的考研人数是341万人,2021年的考研人数是377万人.某省统计了该省其中四所大学2022年的毕业生人数及考研人数(单位:千人),得到如下表格:
大学
A大学
B大学
C大学
D大学
2022年毕业生人数x(千人)
7
6
5
4
2022年考研人数y(千人)
0.5
0.4
0.3
0.2
(1)已知y与x具有较强的线性相关关系,求y关于x的经验回归方程y^=b^x+a^;
(2)假设该省对选择考研的大学生每人发放0.5万元的补贴.
①若该省E大学2022年毕业生人数为8千人,估计该省要发放补贴的总金额;
②若A大学的毕业生中小浙、小江选择考研的概率分别为p,3p-1,该省对小浙、小江两人的考研补贴总金额的期望不超过0.75万元,求p的取值范围.
参考公式:b^=i=1n(xi−x)(yi−y)i=1n(xi−x)2=i=1nxiyi−nxyi=1nxi2−nx2,a^=y−b^x.
解析 (1)由题意得x=4+5+6+74=5.5,y=0.2+0.3+0.4+0.54=0.35,
又i=14xiyi=7×0.5+6×0.4+5×0.3+4×0.2=8.2,
∴i=14xiyi−4xy=8.2-4×5.5×0.35=0.5,
∵i=14xi2=72+62+52+42=126,
∴i=14xi2−4x2=126-4×5.52=5,
∴b^=i=14xiyi−4xyi=14xi2−4x2=0.55=0.1,
∴a^=y−b^x=0.35-0.1×5.5=-0.2,
故y关于x的经验回归方程为y^=0.1x-0.2.
(2)①将x=8代入y^=0.1x-0.2,得y^=0.1×8-0.2=0.6,
估计该省要发放补贴的总金额为0.6×1 000×0.5=300(万元).
②设小浙、小江两人中选择考研的人数为X,则X的所有可能值为0,1,2.
P(X=0)=(1-p)(2-3p)=3p2-5p+2,
P(X=1)=(1-p)(3p-1)+p(2-3p)=-6p2+6p-1,
P(X=2)=p(3p-1)=3p2-p,
∴E(X)=0×(3p2-5p+2)+(-6p2+6p-1)×1+(3p2-p)×2=4p-1,
∴E(0.5X)=0.5×(4p-1)≤0.75,解得p≤58,
又0≤3p-1≤1,
∴13≤p≤23,
∴13≤p≤58,
故p的取值范围为13,58.
考法二 独立性检验的应用
1.(2023届重庆质量检测,18)某大型企业组织全体员工参加体检,为了解员工的健康状况,企业相关工作人员从中随机抽取了40人的体检报告进行相关指标的分析,按体重“超标”和“不超标”制成2×2列联表如下:
超标
不超标
合计
男
16
20
女
15
合计
附:χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
(1)完成题中的2×2列联表,并根据小概率值α=0.001的独立性检验,能否认为该企业员工体重是否超标与性别有关?
(2)若以样本估计总体,用频率作为相应事件的概率.现从该大型企业的男、女员工中各随机抽取一名员工的体检报告,求抽到的两人中恰有一人体重超标的概率.
解析 (1)零假设为H0:体重是否超标与性别无关.依题意可得2×2列联表如下:
超标
不超标
合计
男
16
4
20
女
5
15
20
合计
21
19
40
所以χ2=40×(16×15−4×5)220×20×21×19≈12.13>10.828=x0.001,
根据小概率值α=0.001的独立性检验,没有充分证据推断H0成立,因此可以认为H0不成立,即认为该企业员工体重是否超标与性别有关.
(2)由题意知,从男员工中随机抽取一人,体重超标的概率为45,不超标的概率为15;
从女员工中随机抽取一人,体重超标的概率为14,不超标的概率为34.
所以所求概率P=45×34+15×14=1320.
2.(2023届河北河间一中开学考,20)某市一隧道由于机动车常在隧道内变道、超速,进而引发交通事故,交管部门在该隧道内安装了监控测速装置,并将该隧道某日所有车辆的通行速度进行统计,如图所示.已知通过该隧道车辆的平均速度为64 km·h-1.
(1)求a,b的值,并估计这一天通过该隧道车辆速度的中位数;
(2)为了调查在该隧道内安装监控测速装置的必要性,研究人员随机抽查了通过该隧道的200名司机,得到的答复统计如表所示,根据小概率值α=0.01的独立性检验,能否认为对安装监控测速装置的态度与司机的性别相关?
认为安装监控测速
装置十分必要
认为安装监控测速
装置没有必要
男司机
70
30
女司机
50
50
附:χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
α
0.100
0.050
0.010
0.001
xα
2.706
3.841
6.635
10.828
解析 (1)根据频率和为1可得10×(a+b+0.02+0.01)=1,化简得a+b=0.07,①
又45×0.1+55×0.2+65×10a+75×10b=64,
所以65a+75b=4.85,②
联立①②解得,a=0.04,b=0.03.
因为(0.01+0.02)×10=0.3<0.5,(0.01+0.02+0.04)×10=0.7>0.5,所以所求的中位数为60+0.5−10×(0.01+0.02)0.4×10=65.
(2)零假设为H0:对安装监控测速装置的态度与司机的性别无关.根据表中数据,计算χ2=200×(70×50−30×50)2100×100×80×120≈8.333>6.635=x0.01.
根据小概率值α=0.01的独立性检验,没有充分证据推断H0成立,因此可以认为H0不成立,即认为对安装监控测速装置的态度与司机的性别相关.
3.(2023届广东六校联考,20)足球是一项大众喜爱的运动.2022卡塔尔世界杯揭幕战在2022年11月21日打响,决赛于12月18日晚进行,全程为期28天.
(1)为了解喜爱足球运动是否与性别有关,随机抽取了男性和女性各100名观众进行调查,得到2×2列联表如下:
喜爱足球运动
不喜爱足球运动
合计
男性
60
40
100
女性
20
80
100
合计
80
120
200
依据小概率值α=0.001的独立性检验,能否认为喜爱足球运动与性别有关?
(2)校足球队中的甲、乙、丙、丁四名球员将进行传球训练,第1次由甲将球传出,每次传球时,传球者都等可能地将球传给另外三个人中的任何一人,如此不停地传下去,且假定每次传球都能被接到.记开始传球的人为第1次触球者,第n次触球者是甲的概率记为Pn,即P1=1.
(i)求P3(直接写出结果即可);
(ii)证明:数列Pn−14为等比数列,并比较第19次与第20次触球者是甲的概率的大小.
附:χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)
α
0.10
0.05
0.010
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
解析 (1)零假设H0:喜爱足球运动与性别无关,
根据列联表数据计算得
χ2=200×(60×80−20×40)2100×100×80×120=1003>10.828=x0.001,
根据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为喜爱足球运动与性别有关,此推断犯错误的概率不超过0.001.
(2)(i)由题意得:第二次触球者为乙,丙,丁中的一个,第二次触球者传给包括甲的三人中的一人,故传给甲的概率为13,故P3=13.
(ii)第n次触球者是甲的概率为Pn,则当n≥2时,第n-1次触球者是甲的概率为Pn-1,第n-1次触球者不是甲的概率为1-Pn-1,
则Pn=Pn-1·0+(1-Pn-1)·13=13(1-Pn-1),
从而Pn-14=−13Pn−1−14,
又P1-14=34,∴Pn−14是以34为首项,-13为公比的等比数列.则Pn=34×−13n−1+14,
∴P19=34×−1318+14>14,P20=34×−1319+14<14,
则P19>P20,故第19次触球者是甲的概率大.
专题综合检测
一、单项选择题
1.(2019课标Ⅱ,5,5分)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )
A.中位数 B.平均数
C.方差 D.极差
答案 A
2.(2022湖北八市联考,3)从装有2个红球和2个黑球的袋子内任取2个球,下列选项中是互斥而不对立的两个事件的是( )
A.“至少有1个红球”与“都是黑球”
B.“恰好有1个红球”与“恰好有1个黑球”
C.“至少有1个黑球”与“至少有1个红球”
D.“都是红球”与“都是黑球”
答案 D
3.(2022重庆云阳江口中学期末,8)高三(1)班举行英语演讲比赛,共有六名同学进入决赛,在安排出场顺序时,甲排在后三位,且丙、丁排在一起的概率为( )
A.13 B.16 C.39180 D.47180
答案 B
4.(2022河北省级联测联考五,4)小明参加某项测试,该测试一共3道试题,每道试题做对得5分,做错得0分,没有中间分,小明答对第1,2题的概率都是12,答对第3题的概率是13,则小明答完这3道题的得分期望为( )
A.2512 B.6512 C.203 D.253
答案 C
5.(2023届江苏常州一中检测,4)已知两个随机变量X,Y,其中X~B4,14,Y~N(μ,σ2)(σ>0),若E(X)=E(Y),且P(|Y|<1)=0.4,则P(Y>3)=( )
A.0.4 B.0.3 C.0.2 D.0.1
答案 D
6.(2023届长沙雅礼中学月考一,6)某工厂有甲,乙两个生产车间,所生产的同一批产品合格率分别是99%和98%,已知某批产品的60%和40%分别是甲,乙两个车间生产,质量跟踪小组从中随机抽取一件,发现不合格,则该产品是由甲车间生产的概率为( )
A.34 B.47 C.12 D.37
答案 D
7.(2022重庆八中调研检测七,4)考察下列两个问题:①已知随机变量X~B(n,p),且E(X)=4,D(X)=2,记P(X=1)=a;②甲、乙、丙三人随机到某3个景点去旅游,每人只去一个景点,设A表示“甲、乙、丙所去的景点互不相同”,B表示“有一个景点仅甲一人去旅游”,记P(A|B)=b,则( )
A.a=123,b=12 B.a=124,b=122
C.a=125,b=12 D.a=126,b=122
答案 C
二、多项选择题
8.(2022湖南三湘名校联盟联考,11)记数列{an}的前n项和为Sn,已知Sn=an2-4an+b,在数集{-1,0,1}中随机抽取一个数作为a,在数集{-3,0,3}中随机抽取一个数作为b.在这些不同数列中随机抽取一个数列{an},下列结论正确的是( )
A.{an}是等差数列的概率为13
B.{an}是递增数列的概率为29
C.{an}是递减数列的概率为13
D.Sn≥S2(n∈N*)的概率为13
答案 AB
9.(2022石家庄二中月考,10)下列命题中,正确的是( )
A.已知随机变量X服从二项分布B(n,p),