第六
数理统计
基本概念
第六章第六章 数理统计的基本概念数理统计的基本概念 1 数理统计的基本任务:由部分来推断总体由部分来推断总体,或者由过去来推断未来由过去来推断未来.这样就涉及到两个问题:1)如何选取部分如何选取部分?2)如如何利用部分何利用部分?由于抽取的部分具有一定的随机性,因此据此得出的推论总含有一定程度的不确定性.一般地,在数理在数理统计中所做出的推断我们都可以用一定的概率来表统计中所做出的推断我们都可以用一定的概率来表明推断的可靠或可信程度明推断的可靠或可信程度.这种伴随着一定概率的推断就称为统计推断统计推断.统计推断的含义统计推断的含义 2 6.1 总体和样本总体和样本 对每个个体来说,它有许多方面的特性,而在实际问题中,人们关心的往往只是个体的某个或某几个数量个体的某个或某几个数量指标以及该指标在总体中的概率分布情况指标以及该指标在总体中的概率分布情况.通常我们把被研究的对象的全体称为总体总体,而把组成总体的元素叫做个体个体.一般地,在数理统计中所指的总体总体,就是一个具就是一个具有确定分布的随机变量有确定分布的随机变量,而个体则是该随机变量的一个可能的取值.总体X的分布函数)(xF常常是未知的,统计推统计推断的主要任务就是确定总体的分布断的主要任务就是确定总体的分布 3 为了使所抽取的部分客观地反映总体的特性,我们将依据如下两个假设来从总体中抽取部分:1 1)假设每个个体被抽中的机会是均等的;)假设每个个体被抽中的机会是均等的;2 2)抽取一个个体后不影响总体)抽取一个个体后不影响总体.这种获取部分的方式我们称之为简单随机简单随机抽样抽样.简单随机抽样简单随机抽样 4 设从总体X中依次抽取n个个体进行试验,将这n次 试 验 的 结 果 记 为nXXX,21.显然,nXXX,21随着抽取的n个个体的不同而变化,它们具有随机性,因此它们均为随机变量.依据简单随机抽样假设,第一个假设能保证每次抽样的结果每次抽样的结果(首先是首先是1X)具有与总体具有与总体X相相同的分布同的分布,第二个假设则保证了各次抽样的结各次抽样的结果之间的独立性果之间的独立性,这样就使得nXXX,21是是相互独立的且与总体相互独立的且与总体X具有相同的分布具有相同的分布.5 对抽取的n个个体进行试验,当试验全部完成后,就得到一组实数nxxx,21,它们依次是nXXX,21的观察值,称nxxx,21是样本观察值样本观察值或样本值样本值.定义定义 6.1.1 设(nXXX,21)是n维随机变量,若nXXX,21相互独立且其中每个都 与 总 体X具 有 相 同 的 分 布,则 称(nXXX,21)是取自总体取自总体 X 的容量为的容量为 n的简单随机样本的简单随机样本,简称为样本样本.6 关于样本记号的注关于样本记号的注 大写字母nXXX,21表示的样本是一组随机变量一组随机变量 小写字母12,nx xx表示的样本观察值是一组一组实数实数 在本课件中将严格在上述的意义上使用这些记号,切记不要混淆大小写英文字母之间的含义!7 12,(),nXXXF x若为取自总体的一个样本的联合分布函数为的联合分布函数为则则nXXX,21).(),(*121 niinxFxxxF(),Xf x又若具有概率密度的联合概率密度为的联合概率密度为则则nXXX,21).(),(*121 niinxfxxxf样本的分布样本的分布 8 6.2 统计量与抽样分布统计量与抽样分布 定义定义 6 6.2.1.2.1 设(nXXX,21)是来自总体X的样本,),(21nxxxg是nxxx,21的连续函数,若 g 不含任何未知参数不含任何未知参数,则称),(21nXXXg是统统计 量计 量;若(nxxx,21)是 样 本 观 察 值,则 称),(21nxxxg是该统计量的观察值.由定义,函数21)(1niiXT当,均已知时是统计量,而当,至少有一个是未知时就不是统计量.9 常用的统计量常用的统计量 1、样本均值 称统计量 niiXnX11为样本均值。2、样本方差 称统计量 212)(11XXnSnii为样本方差;称 niiXXnS12)(11为样本标准差。10 3 3、样本矩、样本矩 称 nikikXnA11为样本k 阶矩;称 kniikXXnB)(11为样本k阶中心矩。11 以上定义的各个统计量的观察值分别为:niixnx11niixxns122)(11niixxns12)(11nikikxna11nikikkxxnb1),2,1(;)(112 定理定理 6 6.2.1.2.1 设总体X的数学期望和方差存在,并设)(XE,2()D X,若(nXX,1)是取自总体X的样本,则有)(XE2()D Xn22)(SE证证 首先,对任意的i(ni 1),有()iE X,2()iD X,从而)(1)(11)(11XnEnXEnXnEXEniinii221111()()nniiiiD XDXD Xnnn13 对于样本方差2S,注意到 niniiiniiXnXXXnXXnS1122122)(211)(11niiXnXn122)(1122211()()()1niiE SE XnE Xn2222211()()1ninnn14 顺序统计量顺序统计量 定义定义 6.3.6.3.3 3 设nXXX,21是来自总体X的样本,如果)(kX),2,1(nk是这样的一个统计量,对于任意一组样本观察值(nxxx,21),当我们将其从小到大排成)()2()1(nxxx时,它总是取其中的第k个值)(kx,则称)(kX是样本),(21nXXX的第第 k 位顺序统计量位顺序统计量.特别地,称 ,min21)1(nXXXX 为最小顺序统计量最小顺序统计量,称 ,max21)(nnXXXX 为最大顺序统计量最大顺序统计量.15 经验分布函数经验分布函数 经验分布函数的做法如下:12()(),nS xxXXXx 用表示中不大于的随机变量的个数()nF x 定义经验分布函数为)(),(1)(xxSnxFn总体分布函数F(x)相应的统计量成为经验分布函数经验分布函数 12,nXXXF设是总体的一个样本16 12(1)(2)(),.()nnnx xxnxxxF x一般,设是总体的一个容量为 的样本值将它们按大小次序排列如下:则经验分布函数的观察值为 .,1,0)()()1()()1(nkknxxxxxnkxxxF17 ,()1 (),lim sup()()01.nnnxxnF xF xPF xF x 对于任一实数当时以概率一致收敛于分布函数即 ,()(),().nxnF xF xF x对于任一实数 当充分大 时 经验分布函数的任一个观察值与总体分布函数只有微小的差别 从而在实际上可当作来使用格里汶科定理格里汶科定理 18 定义定义 6 6.2 2.3 3 设随机变量nXXX,21相互独立且均服从标准正态分布)1,0(N,则称随机变量 222221nXXX 所服从的分布是自由度为自由度为 n 的的 分布分布,记为)(22n26.2.2 6.2.2 2分布分布 t分布分布 F分布分布 1 1、2分布分布 19 的概率密度为)(2n12221,0()220,0nxnxexnf xx20 概率密度图形的示意图概率密度图形的示意图 可以将绿色的曲线视为 概率密度的代表图形)(2n05101520253000.050.10.150.20.250.30.350.40.450.5n=2n=6n=1021 分布具有可加性分布具有可加性 2设)(),(22221221nn,且 2221,独立,则)(2122221nn 22 例例6.2.1 若),(22n则 22(),()2En Dn证证 因对ni,2,1,有 22()0,()()()101iiiiE XE XD XE X 24421()ed32xiE Xxx24222()()()3 12iiiD XE XE X.利用独立性有 nXEXEXEEn)()()()(222212222212()()()()2nDD XD XD Xn23 0246810121416182000.020.040.060.080.10.120.14的上 分位数记为)(2n)(2n)(2n22()Pn设)(22n,则 24 2.t2.t分布分布 /XTY n().Tt n所服从的分布为自由度为自由度为n的的t t分布分布,记为 定义定义 6.2.5 6.2.5 设)(),1,0(2nYNX,并且X与Y独立,则称随机变量 25 分布的概率密度为)(nttntnnntfn,)1()2()21()(212注:f(t)是偶函数,因此其图形关于y轴对称.26-5-4-3-2-101234500.050.10.150.20.250.30.350.4n=5n=20N(0,1)n取不同值时取不同值时t t分布及分布及N(0,1)的概率密度的比较图的概率密度的比较图 27 上上 分位数分位数 )(nt若 (),Tt n则有()P Ttn-5-4-3-2-101234500.050.10.150.20.250.30.350.4)(nt28 由对称性知,有 2|()P ttn并且)()(1ntnt-5-4-3-2-101234500.050.10.150.20.250.30.350.42()tn2()tn2229 3.F3.F分布分布 21nYnXF 服从的分布为自由度为自由度为n1,n2的的F分布分布,记为),(F21nnF定义定义 6.3.66.3.6 设)(),(2212nYnX且X与Y独立,则称随机变量 30 0,00,)/(1)2()2()/(2/)()(2/)(2121122/21212111yynxnnnynnnnynnnnF F分布的概率密度为分布的概率密度为 31 00.511.522.533.544.5500.10.20.30.40.50.60.70.80.91n=10,m=25n=10,m=5n=15,m=25F分布密度函数的图形 32 00.511.522.533.544.5500.10.20.30.40.50.60.712(,),F n n),(21nnF分布的上分位数记为),(21nnF 33 由定义,若 12(,),FF n n则 211(,)F nnF12121211(,)(,)111(,)P FF n nPFF n nPFF n n 所以 12111(,)PFF n n 121121(,)(,)Fn nF n n34 例例6.2.26.2.2 设正态总体 ,而 是来自X的样本,令)2,0(2NX),(1521XXX)(22152112102221XXXXXY试确定随机变量Y的分布.解 由已知条件知 )1,0(2NXi15,2,1i222101()()(10)22XXU2221511()()(5)22XXV35 利用样本的独立性知,与 相互独立,于是,由F分布的定义,有 UV22110221115/10(10,5)2()/5XXUYFXXV36 例例 6 6.2 2.3 3 设总体621,),1,0(XXXNX是来自总体X的样本.又设 26542321)()(XXXXXXY 试决定C,使得CY服从2分布。解解 由已知条件及正态分布的独立可加性有)3,0(321NXXX)3,0(654NXXX且321XXX与654XXX相互独立.又对于0C)3,0()(),3,0()(654321CNXXXCCNXXXC26542321)()(XXXCXXXCCY于是当13C,即3/1C时,)2(2CY.37 6.3 正态总体的抽样分布正态总体的抽样分布 定理定理 6.3.16.3.1 若总体),(2NX,则 ),(2nNX 证证 由于nXXX,21相互独立且均服从正态分布),(2N,所以作为它们线性组合的样本均值也服从正态分布,又由定理 6.2.1 知)(XE2()D Xn故 ),(2nNX38 推论推论 若总体),(2NX,则)1,0(/NnX 39 定理定理 6.3.26.3.2 若总体),(2NX,则 1)X与2S相互独立;2)统计量)1()