温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
具有
部分
缺失
数据
混合
分布
参数估计
检验
梁雨晴
梁雨晴,等:具有部分缺失数据的混合幂分布参数估计与检验收稿日期:2022-06-14基金项目:国家自然科学基金(11601039);吉林省教育厅项目(JJKH20210809KJ)作者简介:梁雨晴(1998-),女,硕士研究生,E-mail:通讯作者:施三支(1968-),女,博士,教授,硕士生导师,E-mail:具有部分缺失数据的混合幂分布参数估计与检验梁雨晴,毕利,施三支(长春理工大学数学与统计学院,长春130022)摘要:研究了部分数据缺失情况下混合幂分布总体参数的估计及假设检验问题。通过混合幂分布的密度函数和矩估计方程,求解出混合幂分布中参数的矩估计,证明了估计量的强相合性和渐近正态性。同时讨论了单个混合幂分布的存在性检验问题及两个混合幂分布参数相等的检验问题,构造混合幂分布情况下的检验统计量,并给出检验统计量的极限分布。最后,通过随机模拟验证了估计量的有效性,根据不同样本量及数据缺失比例不同情况下的模拟结果对矩估计方法的可行性进行说明。关键词:混合幂分布;缺失数据;矩估计;假设检验中图分类号:O212.1文献标志码:A文章编号:1672-9870(2023)01-0121-09Parameter Estimation and Test of Mixed Power LawDistribution with Partially Missing DataLIANG Yuqing,BI Li,SHI Sanzhi(School of Mathematics and Statistics,Changchun University of Science and Technology,Changchun 130022)Abstract:This paper studies the estimation and hypothesis test of population parameters of Mixed Power Law Distributionunder the condition of partial data missing.By solving the moment estimation of the parameters in the Mixed Power LawDistribution by the density function and the moment estimation equation of the Mixed Power Law Distribution,the strongcorrespondence and asymptotic normality of the estimator are proved.At the same time,the existence test of single MixedPower Law Distribution and the test of equal parameters of two Mixed Power Law Distributions are discussed.The teststatistics in the case of Mixed Power Law Distribution are constructed,and the limit distribution of the test statistics is giv-en.Finally,the validity of the estimator is verified by random simulation,and the feasibility of the moment estimation meth-od is explained according to the simulation results under different sample sizes and data deletion ratios.Key words:mixed power law distribution;missing data;moment estimation;hypothesis testing目前,有关缺失数据的研究已引起统计学家的广泛关注。而造成数据缺失的原因有很多,如人为疏忽导致的数据输入错误、记录设备故障引起的数据缺失、客观条件约束导致的数据无法获取等。在进行时间序列分析时观测到数据缺失的情况十分普遍,而对取整数值的时间序列模型有数据缺失的研究十分具有挑战性。Jones1(1980)应用极大似然估计方法对具有缺失 数 据 的 ARMA 模 型 的 参 数 进 行 估 计。Alosh(2009)等人2研究了缺失数据对广义整值自回长春理工大学学报(自然科学版)Journal of Changchun University of Science and Technology(Natural Science Edition)Vol.46No.1Feb.2023第46卷第1期2023年2月长春理工大学学报(自然科学版)2023年归模型的影响,并通过模拟实验研究了不同类型的缺失数据对模型参数估计的影响。Andersson 等人3(2010)分别应用条件极大似然法和迭代法研究了数据缺失的情况下一阶整数值自回归模型参数的估计问题。Bondon 等人4(2012)应用最小二乘估计法对具有缺失数据的 ARCH模型的参数进行估计。孙坤等人5(2012)在上述研究的基础上应用矩估计方法对具有部分缺失数据的两个几何分布的参数进行了估计。对于数据完整的不同的整值自回归模型的参数估计方法主要包括:矩估计法(YW)、最小二乘估计法(LS)、极大似然估计法(ML)以及相应 的 变 化 形 式。Jung 等 人6(2005)应 用 Yule-Walker 估计方法和最小二乘估计方法对具有离散支持的条件一阶自回归模型的参数进行了估计。Quinn 等人7(2008)应用拟极大似然法来估计 RCA(1)过程的参数。Aue 等人8(2010)应用极大似然估计方法对一系列随机系数自回归模型的参数进行了估计。Alzaid 等人9(2010)证明了一阶整数值的自回归过程的分布和回归特性。Pedeli 等人10(2015)应用鞍点近似最大似然估计对 INAR(p)模型的参数进行了估计。由于幂分布具有较好的概率统计性质,从而广泛应用于各研究领域,如社会科学、物理学、计算机科学、统计学、经济及金融学等。赵志文等人11(2008)应用极大似然估计方法对具有部分缺失数据的两个幂分布总体中的参数进行估计。赵志文等人12(2016)通过矩估计法对存在部分缺失数据的两个幂分布总体的参数进行估计,证实了估计量的相合性和渐近正态性质,同时构造了参数的检验统计量,并提出检验统计量的极限性质。该文还在上述论文的基础上,进一步讨论了对具有部分缺失数据的混合幂分布的参数估计与假设检验问题。应用矩估计法对模型中的参数进行估计,并根据强大数定律和多元中心极限定理证明了估计量的相合性和渐近正态性,构造了混合幂分布总体参数的检验统计量,并证明了检验统计量的极限分布,最后通过随机模拟证明该方法的可行性。1混合幂分布的参数估计设混合幂分布的密度函数为:f(x,q;1,2)=q 1x1-1+(1-q)2x2-1,0 x 0(i=1,2)是总体的未知参数;q为混合概率。对上述混合幂分布进行n次独立观测,每一个样本观测值的缺失概率为1-p。其中 混 合 幂 分 布 总 体 的 观 测 值 为(Xi,i),i=1,2,n,这里Xi表示来自混合幂分布总体的第i个样本观测值,若第i个样本值缺失,记i=0,否则记i=1。1.1矩估计下面用矩估计方法对混合幂分布密度函数中的未知参数1、2进行估计。基于样本观测值(Xi,i),i=1,2,n,可建立矩估计方程:E(X)=i=1niXii=1niE(X2)=i=1niX2ii=1ni(2)其 中,E(X)=q11+1+(1-q)21+2;E(X2)=q12+1+(1-q)22+2+212q(1-q)(1+1)(1+2)。解方程得未知参数1、2的矩估计分别为:?1=i=1niXi-i=1niX2iq(i=1niXii=1n(iXi)2-2i=1nii=1niXi+2i=1nii=1niX2i)-i=1niXi+i=1niX2i(3)122?2=i=1niXii=1n(iXi)2-2i=1nii=1niXi+2i=1nii=1niX2i2(1-q)-i=1niXii=1n(iXi)2-2i=1nii=1niXi+2i=1nii=1niX2i(4)公式(3)、(4)将应用到 1.2 节渐近性质的证明中。1.2渐近性质及其证明定理 2.1、定理 2.2 及证明分别给出了未知参数估计量的相合性和渐近正态性。定理 2.1 若Xi,i,1 i n来自于混合幂分布总体公式(1)的一组样本,公式(3)与(4)中的?1、?2分别为混合幂分布中参数1、2的矩估计量,则有?1 1,?2 2,a.s.。证明Xii,1 i n为独立同分布随机变量序列,由强大数定律可知:1ni=1nXii E(X11),a.s.(5)其中,E(X11)=E(X1)E(1)=p(q11+1+(1-q)21+2)。即:1ni=1niXi p(q11+1+(1-q)21+2),a.s.(6)同理可得:1ni=1ni p,a.s.(7)1ni=1niX2i p(q12+1+(1-q)22+2+212q(1-q)(1+1)(1+2),a.s.(8)因此:?1=1ni=1niXi-1ni=1niX2iq(1ni=1niXi(1ni=1niXi)2-21ni=1ni1ni=1niXi+21ni=1ni1ni=1niX2i)-1ni=1niXi+1ni=1niX2i 1,a.s.(9)?2=1ni=1niXi(1ni=1niXi)2-21ni=1ni1ni=1niXi+21ni=1ni1ni=1niX2i2(1-q)-1ni=1niXi(1ni=1niXi)2-21ni=1ni1ni=1niXi+21ni=1ni1ni=1niX2i 2,a.s.(10)根据定理 2.1 的证明可知未知参数1、2的矩估计?1、?2具有强相合性。为了证明参数1、2的渐近正态性,引入如下引理 2.1。引理 2.1 记Mn=()M1n,M2n,M3n,MknT,=()1,2,3,kT,令f()t1,t2,t3,tk对各ti有连续偏导数,同 时 设n()Mn-dN()0,,其 中=(aij)k k,0=(0,0,0)T。则 当n 时,有nf()M1n,M2n,M3n,Mkn-f()1,2,3,kdN()0,2,其中2=()fifiij。梁雨晴,等:具有部分缺失数据的混合幂分布参数估计与检验第1期123长春理工大学学报(自然科学版)2023年定理 2.2 在定理 2.1 的条件下,有如下结论成立:n()?1-1dN(0,8-9pp21+21(12+1q+22+2(1-q)+212(1+1)(1+2)q(1-q)p(11+1q+21+2(1-q)(11)n()?2-2dN(0,8-9pp22+22(12+1q+22+2(1-q)+212(1+1)(1+2)q(1-q)p(11+1q+21+2(1-q)(12)证明 令Ti=(i,iXi,iX2i)T,则Ti,i 1是独立同分布随机变量序列,并且E()Ti=(p,p(11+1q+22+1(1-q),p(11+2q+22+2(1-q)+212(1+1)(2+1)q(1-q)令=E()T1-ET1()T1-ET1T,则由多元中心极限定理得出:n()1nTi-ETidN(0,)(13)其中,0=(0,0,0)T,=a11a12a13a21a22a23a31a32a33,且:a11=E()21-E()12=p(1-p),a12=a21=E(21X1)-E(1)E(21X21)=p(1-p)(11+1q+22+1(1-q),a13=a31=E(21X21)-E(1