名师导航
5.1.2
数据的数字特征-2021-2022学年新教材高中数学必修第二册【名师导航】同步Word教参人教B版
5.1
数据
数字
特征
2021
2022
学年
新教材
高中数学
必修
5.1.2 数据的数字特征
学 习 目 标
核 心 素 养
1.会求一组数据的最值、平均数、中位数、百分位数、众数、方差.(重点)
2.理解上述数字特征的意义,并能解决与之相关的实际问题.(难点)
1.通过求数据的数字特征,提升数学运算核心素养.
2.借助数据的数字特征的求解,培养数据分析核心素养.
2019年国际射击联合会世界杯总决赛在福建莆田落下帷幕.中国射击队获得11金15银18铜共44枚奖牌,在奖牌榜上高居首位.这次总决赛中有两位射击运动员在一次射击测试中各射靶十次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
问题:(1)如果你是教练,你应当如何对这次射击情况作出评价?
(2)如果这是一次选拔性考核,你应当如何作出选择?
(3)两人射击的平均成绩是一样的,那么两个人的水平就没有什么差异吗?
(4)什么样的指标可以反映一组数据变化范围的大小?
(5)什么样的指标能反映一组数据与其平均值的离散程度?
[提示] (1)平均成绩一样,s<s,乙比甲成绩稳定.
(2)选乙.
(3)有.
(4)极差.
(5)方差(标准差).
1.最值
一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况.
一般地,最大值用max表示,最小值用min表示.
2.平均数
(1)定义:如果给定的一组数是x1,x2,…,xn,则这组数的平均数为=(x1+x2+…+xn).
这一公式在数学中常简记为=xi.
(2)求和符号∑具有的性质:
① (xi+yi)=xi+yi;
② (kxi)=kxi;
③t=nt.
(3)如果x1,x2,…,xn的平均数为,且a,b为常数,则ax1+b,ax2+b,…,axn+b的平均数是a+b.
3.中位数
(1)如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称xn+1为这组数的中位数;
(2)如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称为这组数的中位数.
4.百分位数
(1)定义:一组数的p%(p∈(0,100))分位数指的是满足下列条件的一个数值:至少有p%的数据不大于该值,且至少有(100-p)%的数据不小于该值.
(2)计算方法:
设一组数按照从小到大排列后为x1,x2,…,xn,计算i=np%的值,如果i不是整数,设i0为大于i的最小整数,取xi0为p%分位数;如果i是整数,取为p%分位数.
规定:0分位数是x1(即最小值),100%分位数是xn(即最大值).
5.众数
一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数.
6.极差
一组数的极差指的是这组数的最大值减去最小值所得的差.
7.方差与标准差
(1)如果x1,x2,…,xn的平均数为,则方差s2= (xi-)2,方差的算术平方根称为标准差.
(2)如果x1,x2,…,xn的方差为s2,且a,b为常数,则ax1+b,ax2+b,…,axn+b的方差是a2s2.
思考:方差与标准差的大小与样本数据有什么关系?
[提示] 标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
1.思考辨析(正确的画“√”,错误的画“×”)
(1)对于一组数据来说,众数是唯一的.( )
(2)中位数在一组数据中是唯一的,且一定是这组数据中的一个数据.( )
(3)x1,x2,x3的平均数为,方差为s2,则2x1-1,2x2-1,2x3-1的平均数为2-1,方差为4s2-1.( )
[提示] (1)× (2)× (3)× [(1)众数可能不唯一.
(2)中位数在一组数据中是唯一的,可能是这组数据中的一个数据,也可能不是这组数据中的数据.
(3)2x1-1,2x2-1,2x3-1的平均数为2-1,方差为4s2,故错误.]
2.下列各数字特征中,能反映一组数据离散程度的是( )
A.众数 B.平均数
C.标准差 D.中位数
C [方差与标准差反映一组数据的离散程度.]
3.一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均值约为( )
A.4.55 B.4.4
C.12.5 D.1.64
A [=≈4.55.]
4.某学员在一次射击测试中射靶10次,命中环数如下:
7,8,7,9,5,4,9,10,7,4.
则:(1)平均命中环数为________;
(2)命中环数的标准差为________.
(1)7 (2)2 [(1)==7.
(2)s2=[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,∴s=2.]
最值、平均数、众数、中位数、百分位数的求法
【例1】 (1)甲、乙两人在10天中每天加工零件的个数分别为
甲:18 19 20 20 21 22 23 31 31 35
乙:11 17 19 21 22 24 24 30 30 32
则这10天甲的日加工零件的平均数为________;乙的日加工零件的众数与中位数分别为________和________.
(2)数据1,2,2,3,5,6,6,7,8,8的40%分位数为____________________________,
75%分位数为________.
[思路探究] (1)由甲、乙的数值求出甲、乙10天中每天加工零件的个数,然后求平均数、众数与中位数.
(2)利用百分位数的计算方法求解.
(1)24 24与30 23 (2)4 7 [(1)甲每天加工零件的个数分别为:18,19,20,20,21,22,23,31,31,35,所求平均数为甲=×(18+19+20+20+21+22+23+31+31+35)=24.
乙每天加工零件的个数分别为:11,17,19,21,22,24,24,30,30,32,故众数为24与30.中位数为×(22+24)=23.
(2)∵40%×10=4,
∴40%分位数为=4;
∵75%×10=7.5,
∴75%分位数为第8个数据7.]
1.最值和众数的求法
在样本数据中出现次数最多的数据即为众数,最大的数是最大值,最小的数是最小值.
2.求平均数的步骤
(1)求和:数据x1,x2,…,xn的和为x1+x2+…+xn.
(2)求平均数:和除以数据的个数n,即x1,x2,…,xn的平均数为(x1+x2+…+xn).
3.求中位数的一般步骤
(1)把数据按大小顺序排列.
(2)找出排列后位于中间位置的数据,即为中位数.若中间位置有两个数据,则求出这两个数据的平均数作为中位数.
4.求百分位数的一般步骤
(1)排序:按照从小到大排列:x1,x2,…,xn.
(2)计算:求i=np%的值.
(3)求值:
分类
p%分位数
i不是整数
xi0,其中i0为大于i的最小整数
i是整数
1.(1)十名工人某天生产同一零件,生产的件数是:15,17,14,10,15,17, 17,16,14,12,设其平均数为a,中位数为b,众数为c,则有( )
A.a>b>c B.c>b>a
C.c>a>b D.b>c>a
(2)在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:
成绩(单位:m)
1.50
1.60
1.65
1.70
1.75
1.80
1.85
1.90
人数
2
3
2
3
4
1
1
1
分别求这些运动员成绩的中位数、25%分位数、75%分位数.
(1)B [从小到大排列此数据为:10,12,14,14,15,15,16,17,17,17.
平均数为(10+12+14×2+15×2+16+17×3)=14.7;
数据17出现了三次,17为众数;
在第5位、第6位均是15,故15为中位数.
所以这组数据的平均数是14.7,中位数是15,众数是17.]
(2)[解] 这组数据有17个数,17×25%=4.25,17×75%=12.75,
这组数据的中位数是x9=1.70,
25%分位数是x5=1.60,75%分位数是x13=1.75.
方差和标准差的计算及应用
【例2】 甲、乙两机床同时加工直径为100 cm的零件,为检验质量,从中抽取6件测量数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算说明哪台机床加工零件的质量更稳定.
[思路探究]
[解] (1)甲=×(99+100+98+100+100+103)=100,
乙=×(99+100+102+99+100+100)=100,
s=×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,
s=×[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)由(1)知甲=乙,比较它们的方差,∵s>s,故乙机床加工零件的质量更稳定.
计算标准差的五个步骤
(1)算出样本数据的平均数.
(2)算出每个样本数据与样本数据平均数的差:xi-(i=1,2,3,…,n).
(3)算出(2)中xi-(i=1,2,3,…,n)的平方.
(4)算出(3)中n个平方数的平均数,即为样本方差.
(5)算出(4)中方差的算术平方根,即为样本标准差.
2.为了了解市民的环保意识,某校高一(1)班50名学生在6月5日(世界环境日)这一天调查了各自家庭丢弃旧塑料袋的情况,有关数据如下表:
每户丢弃旧塑料袋个数
2
3
4
5
户数
6
16
15
13
(1)求这50户居民每天丢弃旧塑料袋的平均数、众数和中位数;
(2)求这50户居民每天丢弃旧塑料袋的标准差.
[解] (1)平均数=×(2×6+3×16+4×15+5×13)==3.7.
众数是3,中位数是4.
(2)这50户居民每天丢弃旧塑料袋的方差为
s2=×[6×(2-3.7)2+16×(3-3.7)2+15×(4-3.7)2+13×(5-3.7)2]=×48.5=0.97.
所以标准差s≈0.985.
样本的数字特征的意义及综合应用
[探究问题]
1.平均数、中位数、众数中,哪一个量与样本的每一个数据都有关,它的缺点是什么?
[提示] 平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但它的缺点是受数据中极端值的影响较大.
2.在电视大奖赛中,计算评委打分的平均值时,为什么要去掉一个最高分和一个最低分?
[提示] 为了避免平均值受数据中个别极端值的影响,增大它在估计总体时的可靠性.
【例3】 据了解,某公司的33名职工月工资(单位:元)如下:
职务
董事长
副董事长
董事
总经理
经理
管理员
职员
人数
1
1
2
1
5
3
20
工资
11 000
10 000
9 000
8 000
6 500
5 500
4 000
该公司职工月工资的平均数与中位数分别为________,在这两个统计量中,________更能反映这个公司员工的工资水平.
[思路探究] 求出中位数与平均数,再根据其反映的数字特征进行判断.
5 333,4 000 中位数 [把工资数据由小到大排列,得到中位数为4 000元.
平均数=
≈5 333元.
由数字知,中位数更能反映该公司员工的工资水平,平均数受少数人工资额的影响较大,不能反映这个公司员工的工资水平.]
1.平均数、众数、中位数的应用
因为平均数与每一个样本数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质,也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于全体样本数据的信息.但平均数受数据的极端值的影响较大,使平均数在估计总体时可靠性降低.
2.标准差(方差)的两个作用
(1)标准差(方差)较大,数据的离散程度较大;标准差(方差)较小,数据的离散程度较小.
(2)在实际应用中,常常把平均数与标准差结合起来进行决策.在平均值相等的情况下,比较方差或标准差来确定稳定性.
3.设矩形的长为a,宽为b,其比满足b∶a=≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中,下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是 ( )
A.甲批次的总体平均数与标准值更接近
B.乙批次的总体平均数与标准值更接近
C.两个批次的总体平均数与标准值接近程度相同
D.两个批次的总体平均数与标准值接近程度不能确定
A [甲==0.617,
乙==0.613,
∴甲与0.618更接近.]
一、知识总结
1.众数、中位数、平均数的意义
(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其中心位置.
2.在计算方差或标准差时,当数据的重复数据较多时,要先把数据整理为频数表再用公式或性质计算.
3.在实际问题中,平均值和方差(或标准差)是评定优劣的两个依据.
二、常见误区
1.计算标准差和方差时公式记错致误.
2.数据同时增加或减少相同的数,平均数变化,方差不变.
1.已知一组数据10,30,50,50,60,70,80.其中平均数、中位数和众数的大小关系是( )
A.平均数>中位数>众数
B.平均数<中位数<众数
C.中位数<众数<平均数
D.众数=中位数=平均数
D [由所给数据可得平均数为50,中位数为50,众数为50,因此众数=中位数=平均数.]
2.2020年某高一学生下学期政治考试成绩为
79 79 84 84 86 84 87 90 90 97
则该生政治考试成绩的平均数和众数依次为( )
A.85 84 B.84 85 C.86 84 D.84 86
C [由题意可知,平均数
==86,
众数为84.]
3.国家射击队要从甲、乙、丙、丁四名队员中选出一名选手去参加射击比赛,四人的平均成绩和方差如下表:
甲
乙
丙
丁
平均成绩
8.5
8.8
8.8
8
方差s2
3.5
3.5
2.1
8.7
则应派________参赛最为合适.
丙 [由表可知,丙的平均成绩较高,且发挥比较稳定,应派丙去参赛最合适.]
4.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为________.
分数
5
4
3
2
1
人数
20
10
30
30
10
[∵==3,
∴s2=(20×22+10×12+30×02+30×12+10×22)
==,∴s=.]
5.甲、乙两台机床在相同的条件下同时生产一种零件,现在从中各抽测10个,它们的尺寸分别为(单位:mm)
甲:10.2 10.1 10.9 8.9 9.9 10.3 9.7 10 9.9 10.1
乙:10.3 10.4 9.6 9.9 10.1 10 9.8 9.7 10.2 10
分别计算上面两个样本的平均数与标准差.如果图纸上的设计尺寸为10 mm,从计算结果看,用哪台机床加工这种零件较合适?
[解] 甲=(10.2+10.1+10.9+…+10.1)=10,
乙=(10.3+10.4+9.6+…+10)=10,
s甲==≈0.477,
s乙=
=≈0.245,
∵甲=乙=10,s甲>s乙,
∴乙比甲稳定,用乙较合适.
13