分享
第04章 抽样和抽样分布.pptx
下载文档

ID:3532110

大小:1.43MB

页数:49页

格式:PPTX

时间:2024-05-20

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
第04章 抽样和抽样分布 04 抽样 分布
第四章 抽样和抽样分布,第一节 ABC公司的抽样问题,ABC公司的人事主管正在制定公司2500名管理人员的简报。其中包括管理人员的平均年薪和已经完成公司管理培训项目的管理人员所占比率。2500名管理人员构成了此项研究的总体。我们可以参照公司的职员记录总体中每个人的年薪和是否完成管理培训项目。假定我们已经获取了总体2500名管理人员的信息。根据前面所学知识,可以计算总体年薪的均值和标准差。,第一节 ABC公司的抽样问题,假定结果为:总体均值:美元总体标准差:美元进一步假设已有1500名管理人员完成了管理培训项目,将总体中已经完成培训项目的职员比率定为p,则p=1500/2500=0.6。,第一节 ABC公司的抽样问题,如何通过抽样的方法对总体的参数进行估计呢?(统计推断),第二节 简单随机抽样,一、有限总体(finite population)的抽样简单随机样本(simple random sample):如果随机样本中每个个体以相等的概率被抽出,则称为简单随机样本。无返回抽样,返回抽样思考:为什么都属于简单随机抽样?,第二节 简单随机抽样,二、简单随机抽样的实现方法1.直接抽选法2.随机数表法3.抽签法,第三节 点估计,一、点估计过程例4-1ABC公司的人事主管正在制定公司2500名管理人员的简报。其中包括管理人员的平均年薪和已经完成公司管理培训项目的管理人员所占比率2500名管理人员构成了此项研究的总体。我们可以参照公司的职员记录总体中每个人的年薪和是否完成管理培训项目。假定我们通过简单随机抽样已获取30名管理人员的信息如下表所示。,第三节 点估计,表4-2 30名管理人员组成的简单随机样本的年薪以及培训,第三节 点估计,问题:总体年薪的均值 是多少?年薪的方差(标准差)是多少?总体中回答:是的比例 是多少?如果以样本均值作为总体参数 的估计,即认为2500名管理人员年薪的均值大概是51805.3美元,这种估计方法称之为点估计。其中 称为估计量(estimator),为总体未知参数。注意估计量与估计值概念的区别。,第三节 点估计,估计未知总体参数的常见的点估计量,第三节 点估计,二、点估计的优良标准 总体未知参数的点估计量不唯一,什么估计量是好的呢?一般来说,一个好的估计量 应具备三个标准:1.无偏性2.有效性3.一致性,第三节 点估计,1.无偏性 若,则称 为 的无偏估计量,C,A,无偏Unbiased,有偏Biased,第三节 点估计,2.有效性,若 则称 比 更有效,思考:更有效的估计量意味着什么?,A,B,样本中位数的分布,样本均值的分布,f,x,样本均值比中位数作为总体均值的估计更有效,更好,第三节 点估计,3.一致性 以样本统计量估计总体参数,要求当样本容量充分大时,样本统计量也充分靠近总体参数。一般来说,如果样本容量增大,估计量 更趋近,就称 为 的一致估计量。这就是说随着样本容量的无限增加,样本统计量和被估计的总体参数之差绝对值小于任意小正数,它的可能性也趋于必然性,即,第四节 抽样分布,一、几个重要的分布(卡方分布、t分布,F分布),第四节 抽样分布,2.与区间估计相关的常见的几种分布介绍 2.1 卡方分布设随机变量 皆服从,且相互独立,则随机变量 所服从的分布称为卡方分布,记着 其中参数n称为自由度,表示平方和中独立随机变量的个数。,第四节 抽样分布,不同自由度的卡方分布密度曲线对比,第四节 抽样分布,例:如果一随机变量X服从自由度为10的卡方分布,求P(X16),x=16,第四节 抽样分布,方法一:用excel函数chidist.chidist(x,deg-freedom)返回P(Xx)。,本例中,P(X16)=1-CHIDIST(16,10)=0.900368,第四节 抽样分布,方法二:查表(参见教材附表3 卡方分布上分位数表),表示卡方变量大于给定值的概率为,P(X16)P(X15.987)=1-P(X15.987)=1-0.1=0.9,第四节 抽样分布,已知概率求随机变量的问题,例如:当自由度为10时,上0.025分位数即P(Xx)=0.025,所对应的值为20.483.下0.025分位数也就是P(X3.247)=1-0.025,第四节 抽样分布,2.2 t分布 设随机变量 相互独立,则随机变量 的分布称为t分布,记着,其中参数n称为自由度。随着自由度n趋于无穷,t分布以标准正态分布为极限。当 时,一般无法在t分布表中查出分位点,此时可以用标准正态分布替代t分布。其密度表达式为可以证明上式在n,密度函数趋于标准正态密度函数,第四节 抽样分布,不同自由度的t分布密度曲线对比,特点1:外形左右关于y轴对称特点2:随着自由度增加,尾巴越来越细特点3:当n超过30时,其密度曲线近乎与标准正态曲线重合,第四节 抽样分布,例:若一随机变量Xt(10),求P(X-1),第四节 抽样分布,方法:通过excel函数TDIST(x,degrees_freedom,tails)X 是需要计算分布的数值。Degrees_freedom 是一个表示自由度的整数。Tails 指定返回的分布函数是单尾分布还是双尾分布。如果tails=1,则TDIST返回单尾分布。如果tails=2,则TDIST返回双尾分布。如果tails=1,TDIST的计算公式TDIST=P(Xx),其中X为服从t分布的随机变量。如果tails=2,TDIST的计算公式为TDIST=P(|X|x)=P(XxorX-x)。,第四节 抽样分布,本例中,P(X1)=TDIST(1,10,1)=0.170447,第四节 抽样分布,已知概率(分位数)求随机变量的问题一般要查表(附表2 t分布上分位数表),例如:当自由度为10时,上0.025分位数即P(Xx)=0.025,所对应的值为2.228.也就是P(X2.228)=0.025,第四节 抽样分布,4.F分布设随机变量 且互相独立,则随机变量 的分布称为自由度为n与m的F分布 记着。,第四节 抽样分布,如何查F分布上分位数表。比如要查上0.1分位数,第一自由度是8,第二自由度位5的分位数,3.34,P(X3.34)=0.1,P(Xx)=,x=F(m,n),第四节 抽样分布,如何查F分布下分位数,比如查下侧0.1分位数,第一自由度为5,第二自由度为8.,P(Xx)=0.1,x,下0.1分位数,P(Xx)=0.9,转化为0.9分位数,但没办法查到0.9的F分布分位数表,第四节 抽样分布,

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开