分享
负超几何及其推广分布的概率计算方法_王福昌.pdf
下载文档

ID:2453669

大小:329.98KB

页数:5页

格式:PDF

时间:2023-06-24

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
几何 及其 推广 分布 概率 计算方法 王福昌
第 43 卷 第 2 期 高 师 理 科 学 刊 Vol.43 No.2 2023 年 2 月 Journal of Science of Teachers College and University Feb.2023 文章编号:1007-9831(2023)02-0011-05 负超几何及其推广分布的概率计算方法 王福昌,贺财宝(防灾科技学院 基础部,河北 三河 065201)摘要:为避免计算负超几何分布的分布律时大阶乘计算导致的计算机上溢问题,利用 Bernoulli 数得到 Stirling 公式,给出!n的高精度近似表达式利用负超几何分布的性质,推导出负超几何分布概率分布律的有效计算方法,并与 R 软件包的计算结果比较,验证了方法的正确性.同时,给出了最小负超几何分布和最大负超几何分布概率分布律的计算方法和相关的比较结果 关键词:Bernoulli 数;Stirling 公式;负超几何分布;最小负超几何分布;最大负超几何分布 中图分类号:O211 文献标识码:doi:10.3969/j.issn.1007-9831.2023.02.003 Probability computation methods of negative hypergeometric and its generalizations distribution WANG Fuchang,HE Caibao(Department of Basic Courses,Institute of Disaster Prevention Science and Technology,Sanhe 065201,China)AbstractAbstract:In order to avoid the computer overflow problem caused by large factorial calculation when calculating the probability distribution of negative hypergeometric distribution,the Stirling formula is obtained by using Bernoulli number,and the high precision approximate expression of!nis givenBased on the property of negative hypergeometric distribution,an effective method to calculate the probability mass function of negative hypergeometric distribution is derived,the correctness of the method is verified by compared with calculation result of R software packageAt the same time,the calculation method of probability mass function of minimum negative hypergeometric distribution and maximum negative hypergeometric distribution and the relative comparison results are given Key wordsKey words:Bernoulli number;Stirling formula;negative hypergeometric distribution;minimum negative hyper-geometric distribution;maximum negative hypergeometric distribution 负超几何分布是一种离散型概率分布,它描述的是为了获得固定数目的成功次数而要进行的试验次数的概率分布文献1定义了负超几何分布,并研究了负超几何分布和超几何分布间的联系,描述了负超几何分布在实际中的应用文献2对负超几何分布参数的最大似然估计的渐近方差做了估计文献3给出了负超几何分布的矩估计量负超几何分布可以用于数据分析3、现代密码学4-5和工农业生产中,但因为涉及阶乘和组合运算,其概率分布的计算非常复杂,特别是当试验次数较大时,直接计算会导致计算机上溢问题现有的统计软件,如 SAS Enterprise Guide,Minitab,SPSS,MATLAB,Excel 等,都没有计算负超几何概率值的功能6.文献7给出了负超几何分布和负二项式分布间的近似关系,文献8给出了负超几何分布的一种 Poisson 近似,然而负超几何分布的负二项分布和 Poisson 分布近似9都需要参数满足一定的使用条 收稿日期:2022-05-07 基金项目:廊坊市科技局科学研究与发展计划项目(2022011031)作者简介:王福昌(1974-),男,山东定陶人,教授,硕士,从事数据分析和优化方法研究E-mail: 12 高 师 理 科 学 刊 第 43 卷 件.为了解决负超几何分布的计算问题,避免试验次数较大时,计算大阶乘出现的计算机上溢问题,常采用阶乘对数法和递推公式法种解决方案阶乘对数法是利用阶乘对数表或对数函数求负超几何分布概率分布律的对数,然后利用指数函数求其反对数当阶乘数很大时,直接采用这种方法计算量会增大,解决方案是利用 Stirling 阶乘近似公式计算彭求实10为提高计算的精度,将 Stirling 公式取为1321112360!2ennnnnn-+-+.递推公式法是利用负超几何分布的性质,找到递推公式,这种算法不会出现计算机上溢,因而计算结果更加精确.本文针对负超几何分布、最小负超几何分布和最大负超几何分布,利 Stirling 公式建立有效的计算公式,便于编程,不存在“溢出”问题.其他涉及大阶乘计算的分布计算可通过类似方法解决,最后通过比较,验证了算法的正确性和有效性 1 Bernoulli 数和 Stirling 公式 为提高对阶乘!n的近似精度,给出 Stirling 公式的高阶近似 函数e1xx-的无穷级数展开式为 0!e1kkxkxxbk=-(1)式中:!kxk的系数kb称为 Bernoulli 数,但有时以函数展开式 2101(1)2(2)!e1kxkxkxxxBk-=+=+-(2)来定义 Bernoulli 数kB.kB与kb的关系为 10121211,0,(1),1,2,2kkkkbbbbBk-+=-=-=(3)对式(2)左端进行 Maclaurin 级数展开,比较相关系数,可以得到116B=,2130B=,3142B=,4130B=,5566B=,66912 730B=,776B=,83 617510B=,943 867798B=,1017 461330B=,.Bernoulli 数出现在许多重要的公式和函数中,其中之一为 Stirling 公式,即 ()()()2211ln!ln2ln2(21)jjjbnnnnnjjn-=+-+-(4)对于任意固定的n,当kn时,有 ()()()2,211ln!ln2ln2(21)kjk njjbnnnnnjjn-=+-+-(5)余项,k n满足1,21(22)(21)kk nkBkkn+在概率分布的计算中,可用 ()()()ln!ln2ln()nnnnnn=+-+(6)近似,式中 ()1735791113151111169113 617():123601 2601 6801 188360 360156122 400nO nnnnnnnnn-=-+-+-+-+(7)由于n较大时,11n-很小,故考虑到既要满足计算的精度,又要展开式简洁优美,一般取表达式()11357911111()123601 2601 6801 188nO nnnnnn-=-+-+(8)第 2 期 王福昌,等:负超几何及其推广分布的概率计算方法 13 2 3 种分布的快速计算公式 在古典概型中,有几种常见的抽样分布,它们的比较和关系见表 1 表 1 古典概型中几种常见抽样方式比较 抽样模式 无限总体重复抽样 有限总体不重复抽样 预先指定抽样次数 二项分布 超几何分布 直到第r次成功 负二项分布 负超几何分布 直到第r次成功或第r次失败 Riff-Shuffle 分布或最小负二项分布 最小负超几何分布 直到第r次成功且第r次失败 最大负二项分布 最大负超几何分布 2.1 负超几何分布 二项分布和负二项分布都是独立重复抽样,当抽样不重复,即做抽样后不放回试验时,分别对应为超几何分布与负超几何分布.定义 11130 设有N件产品,其中有M件次品,其余NM-件为正品今从中任意一次一个不放回地取出,直到取出()r rM个次品时停止,记总共取出的产品数为X,则X的概率分布律为()11111,1,1rk rrMrMNMkN kkMNNCCCCMrP XkkrrrNMNkCC-+=+-+-+(9)称X服从参数为,NMr的负超几何分布,记为(,)XNHG NMr.设服从负超几何分布的随机变量X取值为k的概率值为111rMrkN kMNCCPC-=,则()()()()()()()()()()()()()111lnlnlnln ln(1)!ln(1)!ln()!ln()!ln()!ln()!ln!ln!ln()!rMrMkN kNPCCCkrkrNkMrNMkrNMNM-=+-=-+-+-+-利用式(6)(8),可得()()()()()()()()()()111(1)()()lnln 2ln22(1)()()()(1)ln1(1)ln1()ln ()ln()()ln()ln lnln()ln(1kNk M NMPrkr N Mr NMkrkkrrkrkrNkNkMrMrNMkrNMkrNNMMNMNMk-=-+|-+-+-+-+-+-+-)(1)()()()()()()()rkrNkMrNMkrNMNM-+-+-+-(10)式中:()11357911111()123601 2601 6801 188nO nnnnnn-=-+-+.由于常用的数值计算软件中都内置有对数计算函数,根据式(10),可以编写程序进行计算,截断误差可由式(5)进行估计,一般不超过1010-.由于计算机字长的限制,会有一些舍入误差.当参数大于710时,如果式(10)中参数比较接近,可能会由于减法而损失一些有效数字,但一般情况下都能得到非常准确的结果.为验证算法和计算结果的正确性,将计算结果与统计软件 R 扩展包 extraDistr12自带(需再调用依赖的 Rcpp 包,并设置显示精度,如 options(digits=15)的负超几何分布的 dnhyper()的计算结果进行比较(见表 2)通过对比可以看出,两者非常接近,误差均不超过1110-,说明本文所给计算方法比较准确可靠 表 2 负超几何分布的概率分布数值计算结果对比 分布参数 本文结果 R 扩展包 extraDistr 结果 k=5,N=30,M=10,r=2 0.063 997 305 376 615 0.063 997 305 376 616 k=20,N=100,M=60,r=10 0.059 618 026 177 275 0.059 618 026 177 279 k=100,N=2 000,M=1 000,r=50 0.040 828 148 701 997 0.040 828 148 702 016 k=200,N=10 000,M=8 000,r=160 0.056 867 172 850 525 0.056 867 172 850 580 k=520,N=260 000,M=200 000,r=200 0.031 949 202 537 053 0.031 949 202 536

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开