温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
概率论与数理统计
华东师范大学
概率论
数理统计
课件
第七
茆诗松版
华东师范大学统计系茆诗松、程依明、濮晓龙 研制?7.1 假设检验的基本思想与概念 7.1.1 假设检验问题 例7.1.1 某厂生产的合金强度服从 ,其中 的设计值 为不低于110(Pa)。为保证质量,该 厂每天都要对生产情况做例行检查,以判断生 产是否正常进行,即该合金的平均强度不低于 110(Pa)。某天从生产中随机抽取25块合金,测得强度值为x1,x2,x25,其均值为 (Pa),问当日生产是否正常?(,16)N108x(1)是参数估计问题吗?(2)回答“是”还是“否”,假设检验问题。(3)命题“合金平均强度不低于110Pa”正确与 否仅涉及如下两个参数集合:0:110 1:110 这两个非空参数集合都称作统计假设,简称假设。(4)我们的任务是利用样本去判断假设(命题)“”是否成立。这里的“判断”在统计学中 称为检验或检验法则。07.1.2 假设检验的基本步骤 一、一、建立假设 在假设检验中,常把一个被检验的假设称为原假设,用 表示,通常将不应轻易加以否定的假设作为原假设。当 被拒绝时而接收的假设称为备择假设,用 表示,它们常常成对出现。0H0H1H在例7.1.1中,我们可建立如下两个假设:0:110Hvs1:110H二、选择检验统计量,给出拒绝域形式由样本对原假设进行判断总是通过一个统计量完成的,该统计量称为检验统计量。使原假设被拒绝的样本观测值所在区域称为拒绝域,一般用W 表示,在例7.1.1中,样本均值 愈大,意味着总体均值 也大,因此,合理的拒绝域形如x1(,):nWxxxcxc正如在数学上我们不能用一个例子去证明一个结论一样,用一个样本(例子)不能证明一个命题(假设)是成立的,但可以用一个例子(样本)推翻一个命题。因此,从逻辑上看,注重拒绝域是适当的。事实上,在“拒绝原假设”和“拒绝备择假设(从而接收原假设)”之间还有一个模糊域,如今我们把它并入接收域,所以接收域是复杂的,将之称为保留域也许更恰当,但习惯上已把它称为接收域,没有必要再进行改变,只是应注意它的含义。三、选择显著性水平检验可能犯以下两类错误:其一是 为真但样本观测值落在拒绝域中,从而拒绝原假设 ,这种错误称为第一类错 误,其发生的概率称为犯第一类错误的概率,或称拒真概率,通常记为 其二是 不真(即 为真)但样本观测值落 在接受域中,从而接受原假设 ,这种错误称 为第二类错误,其发生的概率称为犯第二类错 误的概率,或称受伪概率,通常记为 。0H0H.0H1H0H观测数据情况总体情况犯第一类错误正确正确犯第二类错误为真0H 为真1H1(,)nxxW1(,)cnxxW犯第一类错误的概率 和犯第二类错误的概率 可以用同一个函数表示,即所谓的势函数。势函数是假设检验中最重要的概念之一,定义如下:定义7.1.1 设检验问题0011:HvsH的拒绝域为W,则样本观测值落在拒绝域内的概率称为该检验的势函数,记为 01()(),gPWx (7.1.3)势函数 是定义在参数空间 上的一个函数。犯两类错误的概率都是参数 的函数,并可由势函数算得,即:()g01(),()1(),g 对例7.1.1,其拒绝域为 ,由(7.1.3)可以算出该检验的势函数()()4/54/54/5xccgP xcP Wx c这个势函数是 的减函数 由此可得如下结论:利用这个势函数容易写出犯两类错误的概率分别为()4/5,c 0和()1,4/5c 1,当 减小时,c 也随之减小,必导致的增大;当 减小时,c 会增大,必导致 的增大;说明:在样本量一定的条件下不可能找到一个使 和 都小的检验。英国统计学家 Neyman 和 Pearson 提出水平为 的显著性检验的概念。(),g则称该检验是显著性水平为 的显著性检验,简称水平为 的检验。定义7.1.2 对检验问题00:H对11:H如果一个检验满足对任意的 ,0都有 四、给出拒绝域确定显著性水平后,可以定出检验的拒绝域W。在例7.1.1中,若取=0.05,由于g()关于 单调减,只需要5(110)(110)0.054cg 成立即可。这给出c 的值为0.051100.81100.8 1.645cu=108.684检验的拒绝域为108.684Wx若令1104/5xu则拒绝域有另一种表示:0.051.645Wuuu 五、作出判断 在有了明确的拒绝域后,根据样本观测值我们可以做出判断:当 或 时,则拒绝 即接收 ;当 或 时,则接收 108.684x 1.645u 0H1H108.684x 1.645u 在例7.1.1中,由于108108.684x 因此拒绝原假设,即认为该日生产不正常。0H7.2 正态总体参数假设检验 参数假设检验常见的有三种基本形式(1)0010:HvsH(2)0010:HvsH(3)0010:HvsH 当备择假设 在原假设 一侧时的检验称 为单侧检验;0H1H 当备择假设 分散在原假设 两侧时的检验 称为双侧检验。0H1H7.2.1 单个正态总体均值的检验一、已知 时的u 检验设 是来自 的样本,考虑关于 的检验问题。检验统计量可选为1,nxx2(,)N 0/xun三种假设的拒绝域形式分别见下图:WucWuc12Wucuc或10:H(a)10:H(b)(c)10:H该检验用 u 检验统计量,故称为u 检验。下面以 为例说明:0010:HvsH0Puc由 可推出具体的拒绝域为该检验的势函数是 的函数,它可用正态分布写出,具体为 011gnu1Wuu势函数是 的增函数(见图),只要 就可保证在 时有0()g0()g7.2.1(a)的图形()g对单侧检验 是类似的,0010:HvsH只是拒绝域变为:1Wuu其势函数为 0gnu 对双侧检验问题(7.2.3),拒绝域为12Wuu其势函数为 01/201/21gnunu 7.2.1(b)(c)的图形()g例7.2.1 从甲地发送一个讯号到乙地。设乙地接 受到的讯号值服从正态分布 其中 为甲地发送的真实讯号值。现甲地重复发送同 一讯号5次,乙地接收到的讯号值为 2(,0.2),N8.05 8.15 8.2 8.1 8.25设接受方有理由猜测甲地发送的讯号值为8,问能否接受这猜测?解:这是一个假设检验的问题,总体X N(,0.22),检验假设:01:8.:8Hv sH这个双侧检验问题的拒绝域为1/2|uu取置信水平=0.05,则查表知 u0.975=1.96。用观测值可计算得8015,5 8.1580.21.6771xuu 值未落入拒绝域内,故不能拒绝原假设,即接受原假设,可认为猜测成立。二、未知时的t 检验由于未知,一个自然的想法是将(7.2.4)中未知的替换成样本标准差s,这就形成t 检验统计量0n xts(7.2.9)三种假设的检验拒绝域分别为1/2|1.ttn11,ttn1,ttn例例7.2.2 某厂生产的某种铝材的长度服从正态分 布,其均值设定为240厘米。现从该厂抽取5件 产品,测得其长度为(单位:厘米)239.7 239.6 239 240 239.2试判断该厂此类铝材的长度是否满足设定要求?解:这是一个关于正态均值的双侧假设检验问题。采用t 检验,拒绝域为:12(1)ttn现由样本计算得到:t=5 239.5240 0.4=2.7951由于2.79512.776,故拒绝原假设,认为该厂生产的铝材的长度不满足设定要求。若取=0.05,则 t0.975(4)=2.776.239.5,0.4,xs故0/xun11/2|uuuuuu检验法条件检验统计量拒绝域u 检验已知t 检验未知原假设0H备择假设1H00000011/2|uuuuuu0/xun0/xtsn11/2(1)(1)|(1)t tnt t nt tn000000表7.2.1 单个正态总体的均值的检验问题三、假设检验与置信区间的关系 这里用的检验统计量与6.5.5节中置信区间所用的枢轴量是相似的。这不是偶然的,两者之间存在非常密切的关系。设 是来自正态总体 的样本,现在 未知场合讨论关于均值 的检验问题。考虑双侧检验问题:1,nxx2(,)N 0010:HvsH它可以改写为1/201/2(1)(1)ssWxtnxtnnn并且有0()1,PW若让0 在(-)内取值,就可得到 的1-信区间:这里0并无限制.1/2(1)sxtnn01/2|(1)sWxtnn则水平为的检验接收域为 00:H关于 的水平为的显著性检验。00:H是一一对应的。类似地,“参数 的1-置信上限”与“关于00:H 的单侧检验问题的水平的检验”反之若有一个如上的1-置信区间,也可获得所以:“正态均值 的1-置信区间”与“关于 的双侧检验问题的水平的检验”参数 的1-置信下限与另一个单侧检验也是一一对应的。是一一对应的。7.2.2 两个正态总体均值差的检验检验法条件原假设备择假设检验统计量拒绝域u检验已知t 检验未知0H1H12,12,1212121212122212xyumn11/2|uuuuuu11wxytsmn11/2(2)(2)|(2)t tm nt t m nt tm n 12121212121212大样本检u 验 未知m,n充分大近似t 检验未知m,n不很大12,12,22yxxyussmn11/2|uuuuuu22yxxytssmn11/2(1)(1)|(1)ttlttlttl121212121212121212121212444022/,11yxsslsmmnn2220/xyssmsn例7.2.3 某厂铸造车间为提高铸件的耐磨性而 试制了一种镍合金铸件以取代铜合金铸件,为此,从两种铸件中各抽取一个容量分别为 8和9的样本,测得其硬度为 镍合金:76.43 76.21 73.58 69.69 65.29 70.83 82.75 72.34铜合金:73.66 64.27 69.34 71.37 69.77 68.12 67.27 68.07 62.61 根据经验,硬度服从正态分布,且方差保持不变。试在显著性水平下判断镍合金的硬度是否有明显提高。解:用X 表示镍合金的硬度,Y 表示铜合金的硬 度,则由假定,21(,),XN 22(,).YN 要检验的假设是:012112:HvsH经计算,89221173.39,68.2756,()205.7958,()91.1552iiiixyxxyy从而1(205.795891.1552)4.4494892ws 73.3968.27562.2210114.449478t查表知0.95(15)1.7531,t由于0.95(15)tt故拒绝原假设,可判断镍合金硬度有显著提高。7.2.3 正态总体方差的检验一、单个正态总体方差的检验 设 是来自 的样本,对方差亦可考虑如下三个检验问题:1,nxx2(,)N 22220010:HvsH22220010:HvsH22220010:HvsH通常假定 未知,它们采用的检验统计量是相同的,均为 若取显著性水平为,则对应三个检验问题的拒绝域依次分别为22201,ns2211;Wn221;Wn222221211Wnn或例7.2.4 某类钢板每块的重量X 服从正态分布,其一项质量指标是钢板重量的方差不得超过 0.016(kg2)。现从某天生产的钢板中随机抽取 25块,得其样本方差S2=0.025(kg2),问该天生 产的钢板重量的方差是否满足要求。解:原假设为20:0.016,H备择假设为21:0.016,H此处n=25,若取=0.05,则查表知20.952436.4152220124 0.02537.536.4150.016ns由此,在显著性水平0.05下,我们拒绝原假设,认为该天生产的钢板重量不符合要求。现计算可得二、两个正态总体方差比的F 检验 设 是来自 的样本,是来自 的样本。考虑如下三个假设检验问题 1,mxx211(,)N 1,nyy222(,)N 22220010:HvsH22220010:HvsH22220010:HvsH通常 ,均未知,记 ,分别是由算得的 的无偏估计和由 算得的 的无偏估计.122xs2ys1,nyy1,mxx2122可建立检验统计量:22xy