研究探索>>RESEARCHANDEXPLORE41简单随机抽样与逆抽样下0-1总体稀少特征比例估计的精确数值比较○文/张丽一、引言社会经济抽样调查实践中,经常需要估计稀有事件在总体中占比,即估计小概率事件的概率。实施常用的简单随机抽样方案,会出现样本中零稀有事件数的情况,导致产生大的估计偏差。Haldane(1945)[1]开创性地提出一种控制相对方差的抽样方法,称为逆抽样方法(Inversesampling)。之后,该抽样方案被应用于不同领域的实际中。例如,对艾滋病毒感染率进行调查,阳性率P是万分之一,十万分之一。2007年中国农业部对北方布鲁氏杆菌病高发区的10个省区进行了抽样检查,内蒙古土左旗布病阳性率0.104,黑龙社会经济活动中,对于稀有项目在总体中所占比例的调查是个困难的问题。实施经典的简单随机抽样方案容易出现零特征样本导致推断精度差,通常采用逆抽样方案。但是该方案精度的得益理论上不易确定。本文利用蒙特卡洛方法给出了目标量比例的估计值,使用方差公式精确地计算了估计量的方差,比较了两种方案的优劣。江杜尔伯特县阳性率0.084。流行病学研究的重要任务之一就是较为精确地估计出疾病的流行程度。田茂再等(2008)[2]对1983年希腊西北部的Epirus州所爆发的肾脏综合症出血热的发病率的调查,在逆抽样方案下探究7种流行病发病率的逼近与渐近的置信区间估计。陈光慧等(2022)[3]对搜集到的2013年我国工业企业调查数据中,采用广义逆抽样方法获得样本,进而对总体工业总产值总值进行各种不同评估。古丽斯坦·库尔班尼牙孜等(2022)[4]利用独立逆抽样设计抽取样本,验证某种因素对特定罕见疾病的风险,并且基于五种方法构造似然比检验统计量,通过蒙特卡洛模拟从第一类错误的控制能力和检验功效来评价,DOI:10.19454/j.cnki.cn15-1170/c.2023.02.014RESEARCHANDEXPLORE<<研究探索42得出基于样本方差的对数Wald检验统计量在独立逆抽样下最有效的统计量。Kikuchi(2010)[5]开展了一项对165名受试者的调查,研究了低出生体重对母体先天性心脏病暴露的影响,采取逆抽样直到获取指定的暴露次数(即母体先天性心脏病缺陷)为止,来推断低出生体重与母体先天性心脏病的影响。稀少事件的概率推断在抽样调查中可以说常常遇到,再如,对银行信用评估中具有高信用风险客户特征,农产量调查中地理环境恶劣的地区特征等可能会因为抽样的随机性而忽略稀有单元的影响,均可以考虑采用逆抽样设计。关于逆抽样的相关理论与方法研究也有较多的研究,详见[6-...