概率与数理统计
东北大学
概率
数理统计
课件
概率论与数理统计概率论与数理统计 第一节第一节 随机样本随机样本 总体和样本总体和样本 小结小结 数理统计的任务就是研究有效地收集、整理、数理统计的任务就是研究有效地收集、整理、分析所获得的分析所获得的有限有限的资料,对所研究的问题的资料,对所研究的问题,尽尽可能地作出精确而可靠的结论可能地作出精确而可靠的结论.在数理统计中,不是对所研究的对象全体在数理统计中,不是对所研究的对象全体(称称为为总体总体)进行观察,而是抽取其中的部分进行观察,而是抽取其中的部分(称为称为样本样本)进行观察获得数据(进行观察获得数据(抽样抽样),并通过这些数据对总),并通过这些数据对总体进行推断体进行推断.数理统计方法具有“部分推断整体”的数理统计方法具有“部分推断整体”的 特征特征.在数理统计研究中,人们往往研究有关对象的在数理统计研究中,人们往往研究有关对象的某一项某一项(或几项或几项)数量指标和为此,对这一指标进行数量指标和为此,对这一指标进行随机试验,观察试验结果全部观察值,从而考察该随机试验,观察试验结果全部观察值,从而考察该数量指标的分布情况数量指标的分布情况.这时,每个具有的数量指标的这时,每个具有的数量指标的全体就是总体全体就是总体.每个数量指标就是个体每个数量指标就是个体.某批某批 灯泡的寿命灯泡的寿命 该批灯泡寿命的全该批灯泡寿命的全体就是总体体就是总体 国产轿车每公里国产轿车每公里 的耗油量的耗油量 国产轿车每公里耗油量国产轿车每公里耗油量的全体就是总体的全体就是总体 一一个统计问题总有它明确的研究对象个统计问题总有它明确的研究对象.1.1.总体总体 研究某批灯泡的质量研究某批灯泡的质量 研究对象的全体称为研究对象的全体称为总体总体,总体总体 一、总体和样本一、总体和样本 总体中所包含的个体的个数称为总体的总体中所包含的个体的个数称为总体的容量容量.总体中每个成员称为总体中每个成员称为个体个体,总体总体 有限总体有限总体 无限总体无限总体 因此在理论上可以把总体与概率分布等同起来因此在理论上可以把总体与概率分布等同起来.我们关心的是总体中的个体的某项指标我们关心的是总体中的个体的某项指标(如人的如人的身高、灯泡的寿命身高、灯泡的寿命,汽车的耗油量汽车的耗油量).由于每个个体的出现是随机的,所以相应的数量指由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性标的出现也带有随机性.从而可以把这种数量指标看从而可以把这种数量指标看作一个随机变量作一个随机变量X ,因此随机变量,因此随机变量X的分布就是该数的分布就是该数量指标在总体中的分布量指标在总体中的分布.总体就可以用一个随机变量及其分布来描述总体就可以用一个随机变量及其分布来描述.例如例如:研究某批灯泡的寿命时,关心的数量指标研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量就是寿命,那么,此总体就可以用随机变量X表示,表示,或用其分布函数或用其分布函数F(x)表示表示.某批某批 灯泡的寿命灯泡的寿命 总体总体 寿命寿命 X 可用一概率可用一概率(指数)分布来刻划(指数)分布来刻划 鉴于此,常用随机变量的记号鉴于此,常用随机变量的记号 或用其分布函数表示总体或用其分布函数表示总体.如如 说总体说总体X或总体或总体F(x).体体寿命总体是指数分布总寿命总体是指数分布总 类似地,在研究某地区中学生的营养状况时类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,我们用若关心的数量指标是身高和体重,我们用X 和和Y 分分别表示身高和体重,那么此总体就可用二维随机变别表示身高和体重,那么此总体就可用二维随机变量量(X,Y)或其联合分布函数或其联合分布函数 F(x,y)来表示来表示.统计中,总体这个概念统计中,总体这个概念 的要旨是:的要旨是:总体就是一个概总体就是一个概 率分布率分布.参数的分布,为推断总体分布及各种特征,按一参数的分布,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息获得有关总体的信息,这一抽取过程称为,这一抽取过程称为“抽抽样样”,所抽取的部分个体称为”,所抽取的部分个体称为样本样本.样本中所包样本中所包含的个体数目称为样本容量含的个体数目称为样本容量.2.样本样本 从国产轿车中抽从国产轿车中抽5辆辆进行耗油量试验进行耗油量试验 样本容量为样本容量为5 抽到哪抽到哪5辆是随机的辆是随机的 总体分布一般是未知,或只知道是包含未知总体分布一般是未知,或只知道是包含未知 一旦取定一组样本一旦取定一组样本X1,,Xn ,得到得到n个具体的数个具体的数(x1,x2,xn),称为样本的一次观察值,简称样本值,称为样本的一次观察值,简称样本值.n称为这个样本的容量称为这个样本的容量.21nXXXnX,观察,其结果依次记为观察,其结果依次记为次重复、独立次重复、独立在相同的条件下,进行在相同的条件下,进行对总体对总体.,21分布分布同的同的与总体随机变量具有相与总体随机变量具有相的一个简单随机样本,的一个简单随机样本,是来自总体是来自总体这样得到的随机变量这样得到的随机变量XXXXn最常用的一种抽样叫作“最常用的一种抽样叫作“简单随机抽样简单随机抽样”,其特点:”,其特点:1.代表性代表性:X1,X2,Xn中每一个与所考察的总体有中每一个与所考察的总体有 相同的分布相同的分布.2.独立性独立性:X1,X2,Xn是相互独立的随机变量是相互独立的随机变量.定义:定义:.nXx,x,xnXFFX,X,XFX,X,XFXn21n21n21个独立的观察值个独立的观察值的的又称为又称为称为样本值,称为样本值,值值简称样本,它们的观察简称样本,它们的观察为的简单随机样本,为的简单随机样本,)得到的容量)得到的容量、或总体、或总体(或总体(或总体为从分布函数为从分布函数变量,则称变量,则称的、相互独立的随机的、相互独立的随机是具有同一分布函数是具有同一分布函数的随机变量,若的随机变量,若是具有分布函数是具有分布函数设设 由简单随机抽样得到的样本称为由简单随机抽样得到的样本称为简单随机样本简单随机样本,它可以用与总体独立同分布的它可以用与总体独立同分布的n个相互独立的随机个相互独立的随机变量变量X1,X2,Xn表示表示.简单随机样本是应用中最常见的情形,今后,简单随机样本是应用中最常见的情形,今后,当说到“当说到“X1,X2,Xn是取自某总体的样本”时,若是取自某总体的样本”时,若不特别说明,就指简单随机样本不特别说明,就指简单随机样本.=F(x1)F(x2)F(xn)若总体的分布函数为若总体的分布函数为F(x)、概率密度函数为、概率密度函数为f(x),则其简单随机样本的联合分布函数为则其简单随机样本的联合分布函数为),(2*nxxxF其简单随机样本的联合概率密度函数为其简单随机样本的联合概率密度函数为),(2*nxxxf=f(x1)f(x2)f(xn).),(,),(,)0(2121的概率密度的概率密度求样本求样本是来自总体的样本是来自总体的样本布布的指数分的指数分服从参数为服从参数为设总体设总体nnXXXXXXX 解解 的概率密度为的概率密度为总体总体X ,0,0,0,e)(xxxfx ,21有相同的分布有相同的分布且与且与相互独立相互独立因为因为XXXXn的概率密度为的概率密度为所以所以),(21nXXX)(),(121 niinnxfxxxf .,0,0,e1其他其他ixnxnii 例例1.),(,),(,10),1(2121的分布律的分布律求样本求样本是来自总体的样本是来自总体的样本其中其中服从两点分布服从两点分布设总体设总体nnXXXXXXppBX 解解 的分布律为的分布律为总体总体X,21相互独立相互独立因为因为nXXXiippiXP 1)1()1,0(i,有相同的分布有相同的分布且与且与X的分布律为的分布律为所以所以),(21nXXX例例2,2211nnxXxXxXP 2211nnxXPxXPxXP niiniixnxpp11)1(.1,0,21中取值中取值在集合在集合其中其中nxxx 事实上我们抽样后得到的资料都是具体的、确事实上我们抽样后得到的资料都是具体的、确定的值定的值.如我们从某班大学生中抽取如我们从某班大学生中抽取10人测量身高人测量身高,得到得到10个数,它们是样本取到的值而不是样本个数,它们是样本取到的值而不是样本.我我们只能观察到随机变量取的值而见不到随机变量们只能观察到随机变量取的值而见不到随机变量.3.总体、样本、样本值的关系总体、样本、样本值的关系 总体(理论分布)总体(理论分布)?样本样本 样本值样本值 统计是从手中已有的资料统计是从手中已有的资料-样本值,去推断总样本值,去推断总体的情况体的情况-总体分布总体分布F(x)的性质的性质.总体分布决定了样本取值的概率规律,也就是总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断样本取到样本值的规律,因而可以由样本值去推断总体总体.样本是联系二者的桥梁样本是联系二者的桥梁 二、小结二、小结 研究对象的全体称为总体研究对象的全体称为总体 总体中每个成员称为个体总体中每个成员称为个体.nXFFX,X,XFX,X,XFXnn为的简单随机样本为的简单随机样本)得到的容量)得到的容量、或总体、或总体(或总体(或总体为从分布函数为从分布函数变量,则称变量,则称的、相互独立的随机的、相互独立的随机是具有同一分布函数是具有同一分布函数的随机变量,若的随机变量,若是具有分布函数是具有分布函数设设2121.简称样本简称样本概率论与数理统计概率论与数理统计 第二节第二节 抽样分布抽样分布 统计量与经验分布函数统计量与经验分布函数 统计三大抽样分布统计三大抽样分布 几个重要的抽样分布定理几个重要的抽样分布定理 课堂练习课堂练习 由样本值去推断总体情况由样本值去推断总体情况,需要对样本值进需要对样本值进行行“加工加工”,这就要构造一些样本的函数这就要构造一些样本的函数,它把它把样本中所含的样本中所含的(某一方面某一方面)的信息集中起来的信息集中起来.1.统计量统计量 这种这种不含任何未知参数的样本的函数称为统不含任何未知参数的样本的函数称为统计量计量.它是完全由样本决定的量它是完全由样本决定的量.一、统计量与经验分布函数一、统计量与经验分布函数 定义定义 请注意请注意:几个常见统计量几个常见统计量 样本平均值样本平均值 它反映了它反映了 总体均值总体均值 的信息的信息 样本方差样本方差 它反映了总体它反映了总体 方差的信息方差的信息 样本标准差样本标准差 它反映了总体它反映了总体k 阶矩的信息阶矩的信息 样本样本k阶原点矩阶原点矩 样本样本k阶中心矩阶中心矩 k=1,2,它反映了总体它反映了总体k 阶阶 中心矩的信息中心矩的信息 统计量的观察值统计量的观察值 请注意请注意:2.经验分布函数经验分布函数.10)()(suplim ,)(1 )(,xFxFPxFxFnxnxnn即即一致收敛于分布函数一致收敛于分布函数以概率以概率时时当当对于任一实数对于任一实数.)(,)()(,使用使用来来从而在实际上可当作从而在实际上可当作只有微小的差别只有微小的差别与总体分布函数与总体分布函数数的任一个观察值数的任一个观察值经验分布函经验分布函时时充分大充分大当当对于任一实数对于任一实数xFxFxFnxn3.格里汶科定理格里汶科定理 二、统计三大抽样分布二、统计三大抽样分布 记为记为 分布分布 1、定义定义:设设 相互独立相互独立,都服从正态分布都服从正态分布 N(0,1),则称随机变量:则称随机变量:所服从的分布为所服从的分布为自由度为自由度为 n 的的 分布分布.分布是由正态分布派生出来的一种分布分布是由正态分布派生出来的一种分布.00,e)2(21)(2122其他其他yynyfynn1.设设 相互独立相互独立,都服从正态分布都服从正态分布 则则 这个性质叫这个性质叫