分享
检验统计量对假设检验影响效果分析.pdf
下载文档

ID:3117987

大小:725.22KB

页数:5页

格式:PDF

时间:2024-01-21

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
检验 统计 假设检验 影响 效果 分析
收稿日期2 0 2 1-0 9-0 7;修改日期2 0 2 2-0 9-2 9 基金项目科技部国家科技攻关计划(2 0 2 0 Y F B 1 7 1 1 2 0 4);2 0 1 9年上海高校本科重点教改项目;上海交通大学2 0 2 0年教育教学研究项目(J Y J X 2 0 0 2 0 3)作者简介卫淑芝(1 9 6 4-),女,博士,副教授,从事金融数学,金融统计研究.E-m a i l:s z w e i s j t u.e d u.c n 通讯作者张兴旭(1 9 9 0-),女,博士在读,教育学原理专业.E-m a i l:z h a n g x i n g x u s j t u.e d u.c n第3 9卷第3期大 学 数 学V o l.3 9,.32 0 2 3年6月C O L L E G E MATHEMAT I C SJ u n.2 0 2 3检验统计量对假设检验影响效果分析卫淑芝1,张兴旭2,周 越3(1.上海交通大学 数学科学学院,上海2 0 0 2 4 0;2.上海交通大学 教学发展中心,上海2 0 0 2 4 0;3.上海交通大学 电子信息与电气工程学院,上海2 0 0 2 4 0)摘 要基于单正态总体的两个参数的假设检验,通过理论分析与数值结果论证了检验统计量在假设检验效果影响因素中的核心地位.关键词假设检验;检验统计量;第类错误 中图分类号O 2 1 2.2 文献标识码C 文章编号1 6 7 2-1 4 5 4(2 0 2 3)0 3-0 0 9 3-0 51 引 言假设检验是统计推断最基本的方法之一,在统计决策中发挥着十分重要的作用.在做假设检验时,可以概括为四步:第一步,根据实际问题,合理的提出原假设与备择假设;第二步,在原假设的基础上,构造检验统计量;第三步,确定拒绝原假设的区域(简称拒绝域);第四步,根据样本数据做出拒绝或不拒绝原假设的结论.从假设检验的步骤可以看到,构造检验统计量是最为关键的一步,如果不能构造出合理的检验统计量,就无法完成假设检验,可见,检验统计量在假设检验过程中处于核心地位.假设检验是根据样本推断总体的决策,人们自然希望这个决策能足够精确,几乎不发生错误.然而,在完成了检验统计量的构造之后,假设检验所采用的原理是“小概率事件在一次实验中几乎不可能发生”,这就导致两类错误的发生在所难免1-2,那么追求一个效果好的假设检验,就只能要求两类错误发生的概率都尽可能小.事实上,假设检验这个方法决定了可以控制第I类错误的概率,因此,评估一个假设检验的效果其实就是评估第类错误发生的概率.换句话说,对于一个假设检验来说,如果把犯第I类错误的概率控制在相同的水平,那么犯第类错误的概率相对较小的假设检验,其效果自然是更好的.由此来看,就需要研究哪些因素会影响犯第类错误的概率.在假设检验中,计算犯第类错误的概率需要对相关的概念有比较深入理解,是本科生概率统计学习中的一个难点,计算第类错误概率、影响犯第类错误概率因素的相关研究文献已有不少3-6,但是,没有查阅到第类错误受检验统计量影响的相关研究,而这也正是概率统计学习中非常底层的问题.本文研究结论不仅有助于解答假设检验这个统计推断方法的一些根本性问题,而且有助于学生对相关统计学理论、方法的深入理解与应用.2 检验统计量的选取问题设X1,X2,Xn为正态总体N(,2)的一个容量为n简单样本,样本均值、样本方差与样本标准差分别记为X=1nni=1Xi,S2=1n-1ni=1Xi-X 2,S=1n-1ni=1Xi-X 2,引言中提到,构造合理检验统计量是假设检验的核心问题,学习过概率统计的读者都知道,对于N(,2)中参数和2的假设检验,(i)如果2已知,无论原假设是H0=0,H00,还是H00,所采用的检验统计量都为U=X-0/n N(0,1).事实上,按照构造检验统计量的相关要求1-2,T=X-0S/nt(n-1)也是可以作为检验统计量的,然而,基本没有相关的文献说明其不被选作检验统计量的原因.(i i)如果已知,无论原假设是H02=20,H0220,还是H0220,所采用的检验统计量都为21=120ni=1Xi-22(n).同(i)类似的情况,按照构造检验统计量的相关要求1-2,22=120ni=1Xi-X 22(n-1)也是可以作为检验统计量的,然而,基本也没有相关的文献说明其不被选作检验统计量的原因.从下面的论证可以看到,其原因正是犯第类错误概率的比较问题.3 检验统计量选取问题的论证与解析本部分以右侧检验为例,对上述问题给予论证.3.1 第类错误概率的解析表示定理1 设正态总体N(,2),其中2已知,对参数的右侧检验来说,当H1成立时(不妨设=1,10),(i)若采用检验统计量U=X-0/n N(0,1),第类错误的概率为U=0-1/n+u ;(i i)若采用检验统计量T=X-0S/nt(n-1),第类错误的概率为T=+00-1/n+tt(n-1)fS(t)dt.其中,(x)为标准正态分布的分布函数,fS(t)是随机变量S的概率密度,且fS(t)=12n-12n-12 e-(n-1)t222(n-1)t22 n-322(n-1)t2,t0,0,t0.关于fS(t)的简单推导见附录.证 所谓犯了第类错误,是指当H1成立(即=1,10成立)时,接受了H0.(i)如果选用检验统计量为U,犯第类错误的概率为U=PX-0/nu =PX-1/n0-1/n+u ,因为H1=1成立,所以X-1/n N(0,1),由上式得U=0-1/n+u .(i i)如果选用检验统计量为T,犯第类错误的概率为T=PX-0S/nt(n-1)=PX-1/n0-1/n+St(n-1),因为H1=1成立,一方面X-1/n N(0,1),另一方面S的概率密度为fS(t),由上式49大 学 数 学 第3 9卷T=+0 0-1/n+tt(n-1)-12 e-x22dx fS(t)dt=+0 0-1/n+tt(n-1)fS(t)dt.定理2 设正态总体N(,2),其中已知,对参数2的右侧检验来说,当H1成立时(不妨设2=21,2120),(i)若采用21=120ni=1Xi-22(n)为检验统计量,犯第类错误的概率为21=F2120212(n)=20212(n)012n2n2 e-x2xn2-1dx.(i i)若采用22=120ni=1Xi-X 22(n-1)为检验统计量,犯第类错误的概率为22=F2220212(n-1)=20212(n-1)012n-12n-12 e-x2xn-32dx.其中,F21(x),F22(x)分别为随机变量21与22的分布函数,(x)=+0tx-1e-tdt.证 对参数2的右侧检验来说,所谓犯了第类错误,是指当H1成立,即2=21,2120成立时,接受了H0.(i)若选用检验统计量为21,犯第类错误的概率为21=P120ni=1Xi-22(n)=P121ni=1Xi-220212(n).由于2=21,所以121ni=1Xi-22(n),由上式得21=F2120212(n)=20212(n)012n2n2 e-x2xn2-1dx.(i i)若选用检验统计量为22,犯第类错误的概率为22=P120ni=1Xi-X 22(n-1)=P121ni=1Xi-X 220212(n-1),由于2=21,所以121ni=1Xi-X 22(n-1),由此得22=F2220212(n-1)=20212(n-1)012n-12n-12 e-x2xn-32dx.3.2 第类错误的概率的比较从定理1与定理2可看出,直接利用解析式比较第类错误的概率是非常困难的,下面利用p y t h o n程序运算,给出一些数值结果的比较.(i)在参数的检验中,取1=0+1,=2,表1与表2分别给出不同显著性水平与不同样本容量时,第类错误概率的比较结果.表1 n=2 0时,的检验中不同显著性水平下第类错误的概率显著性水平0.0 10.0 2 50.0 50.10.2第类错误的概率U0.5 3 60.3 9 1 20.2 7 7 20.1 6 9 90.0 8 1 6T0.5 9 8 20.4 3 5 50.3 0 4 80.1 8 2 60.0 8 4 859第3期 卫淑芝,等:检验统计量对假设检验影响效果分析表2=0.0 5时,的检验中不同样本容量下第类错误的概率样本容量51 01 52 02 53 0第类错误的概率U0.7 0 0 80.5 2 5 40.3 8 5 30.2 7 7 20.1 9 6 20.1 3 7T0.7 6 10.5 7 2 70.4 2 1 90.3 0 4 80.2 1 6 60.1 5 1 7(i i)在参数2的检验中,取2021=0.5,表3与表4分别给出不同显著性水平与不同样本容量时,第类错误概率的比较结果.表3 n=2 0时,2的检验中不同显著性水平下第类错误的概率显著性水平0.0 10.0 2 50.0 50.10.2第类错误的概率210.4 6 40.3 5 2 50.2 6 5 30.1 8 0 10.1 0 2 9220.4 8 3 90.3 7 1 30.2 8 20.1 9 3 60.1 1 2 3表4=0.0 5时,2的检验中不同样本容量下第类错误的概率样本容量51 01 52 02 53 0第类错误的概率210.6 4 5 90.4 8 2 40.3 5 90.2 6 5 30.1 9 4 60.1 4 1 9220.6 8 5 40.5 1 1 40.3 8 1 10.2 8 20.2 0 7 20.1 5 1 23.3 结论当第I类错误概率控制在相同的水平时(不超过),由表1、表2不难发现,上述(i)中用检验统计量U比用T所做出的决策发生第类错误的概率相对较小;由表3、表4可看出,(i i)中用检验统计量21比用22所做出的决策发生第类错误的概率相对较小.并且,无论样本容量多大,无论显著性水平如何,这些结论都是不变的.当然,随着样本容量越来越大,第类错误概率较小的假设检验,其效果所呈现的优势越来越不明显,这是非常容易理解、而且也是很合理的现象.另外,需要说明一点,因为数值计算,这里仅仅提供了一些特殊参数的结果,对于其它参数也有同样的结论,鉴于篇幅的问题,这里就不赘述.4 总 结前面基于单正态总体的情况,通过理论分析与数据结果论证了检验统计量的选取是影响假设检验效果的根本因素.本文仅就单正态总体两个参数的右侧检验给予了说明,左侧检验和双侧检验方法完全类似,可以得出相同的结论.事实上,在任何假设检验中,检验统计量的选择都是核心问题.比如,对于两个正态总体N(1,21),N(2,22),当21=22=2(2未知时),参数1-2的假设检验中,无论原假设是H01-2=,H01-2,还是H01-2,所采用的检验统计量都为T=X-Y-1n+1mSt(n+m-2),其中S=(n-1)S21+(m-1)S22n+m-21.而按照构造统计量的要求T1=X-Y-1n+1mS1t(n-1)与69大 学 数 学 第3 9卷T2=X-Y-1n+1mS2t(m-1)也都可以作为检验统计量.没有选取T1与T2作为检验统计量,其原因与前述论证类似,当第I类错误概率控制在相同的水平下(不超过),用检验统计量T做出的决策发生第类错误的概率相对较小,这个问题的论证应该更复杂一些,将作为进一步的研究.再比如,在非参数的分布拟合检验中,P e a r s o n(皮尔逊)构造了一个近似的2分布作为检验统计量1-2,是否可以构造检验效果更好的统计量,这显然是值得研究的内容.总之,在概率论与数理统计中,这类问题还有很多,它们不仅仅需要研究,更重要的是教学过程中应该启发学生进行评判性思维,养成评判性学习的习惯.教学不应该仅仅停留于知识传授层面,更重要的是培养学生的思考与研究能力.致谢 作者非常感谢相关文献对本文的启发以及审稿专家提出的宝贵意见.附录(S的概率密度fS(t)的推导)令(n-1)S22=Y,显然,S=Yn-1.由于Y2(n-1),Y的概率密度为fY(y)=12n-12n-12 e-y2yn-32,y0,0,t0.其中(x)=+0tx-1e-tdt.利用文献1 定理2.4.1,易得S的概率密度fS(t)为fS(t)=fY(n-1)t22 2(n-1)t2,t0,0,t0,即fS(t)=12n-12n-12 e-(n-1)t222(n-1)t22 n-322(n-1)t2,t0,0,t0.参 考 文 献1 卫淑芝,熊德文,皮玲.概率论与数理统计 基于案例分析M.北京:高等教育出版社,2 0 2 0:6 2,2 1 3-2 4 0.2 茆诗松,程依明,濮晓龙.概率论与数理统计教程M.2版.北京:高等教育出版社,2 0 1 1:3 5 6-3 9 7.3 何朝葵,夏乐天.假设检验问题解题步骤之我见J.大学数学,2 0 1 3,2 9(4):1 1 6-1 1 8.4 胡菊华.假设检验中的原假设选取问题J.大学数学,2 0 1 3,2 9(5):1 4 0-1 4 3.5 付英,鲜思东.基于可信度的统计检验决策研究J.数学的实践与认识,2 0 1 9,4 9(8):2 4 3-2 4 8.6 张晓琴,王昭元,李宇.单侧假设检验中统计量值对检验结论的影响J.大学数学,2 0 2 0,3 6(6):3 7-4 1.E f f e c tA n a l y s i so fT e s tS t a t i s t i c so nH y p o t h e s i sT e s tWE IS h u z h i1,Z HANGX i n g x u2,Z HOUY u e3(1.S c h o o l o fM a t h e m a t i c a lS c i e n c e s,S h a n g h a i J i a oT o n gU n i v e r s i t y,S h a n g h a i 2 0 0 2 4 0,C h i n a;2.C e n t e r f o rT e a c h i n ga n dL e a r n i n gD e v e l o p m e n t,S h a n g h a i J i a oT o n gU n i v e r s i t y,S h a n g h a i 2 0 0 2 4 0,C h i n a;3.S c h o o l o fE l e c t r o n i c I n f o r m a t i o na n dE l e c t r i c a lE n g i n e e r i n g,S h a n g h a i J i a oT o n gU n i v e r s i t y,S h a n g h a i 2 0 0 2 4 0,C h i n a)A b s t r a c t:T h i ss t u d yi sb a s e do nt h eh y p o t h e s i st e s t i n go ft w op a r a m e t e r so fs i n g l en o r m a lp o p u l a t i o n.T h r o u g ht h e o r e t i c a l a n a l y s i sa n dn u m e r i c a l r e s u l t s,i td e m o n s t r a t e st h ec o r ep o s i t i o no f t e s ts t a t i s t i c s i nt h e i n f l u e n c i n gf a c t o r so fh y p o t h e s i s t e s t i n ge f f e c t.K e yw o r d s:h y p o t h e s i s t e s t;t e s t s t a t i s t i c s;t y p e se r r o r79第3期 卫淑芝,等:检验统计量对假设检验影响效果分析

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开