分享
2022年医学专题—第四篇抽样和分布1(药学)(1).ppt
下载文档

ID:2417056

大小:912.50KB

页数:28页

格式:PPT

时间:2023-06-20

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
2022 医学 专题 第四 抽样 分布 药学
数理统计学,第一页,共二十八页。,通过抽取总体中的部分(样本)进行观察获得数据(抽样(chu yn)),并通过这些数据对总体进行推断。,一、数理统计研究(ynji)的问题,(1)怎样设计试验,决定观察(gunch)的数目;,(2)怎样利用试验观察的结果作出一个“好”的推断等。,第一个问题是怎样进行抽样,使抽得的样本更合理,并有更好的代表性?这是抽样方法和试验设计问题.,第二个问题是怎样从取得的样本去推断总体?这种推断具有多大的可靠性?这是统计推断问题.,第二页,共二十八页。,统计方法具有“部分(b fen)推断整体”的特征.,因为从一小部分样本观察值去推断全体对象(总体),即由部分推断全体。这里(zhl)使用了“归纳推理”的方法,它不同于数学中的“演绎推理”。,归纳推理(u n tu l)-根据观察到的大量个别情况,归纳推断总体。演绎推理-从一些假设、命题、已知的事实等出发,按一定的逻辑推理得出结果。,二、数理统计方法的特点,第三页,共二十八页。,例如,在几何学中要证明(zhngmng)“等腰三角形底角相等”,只须从“等腰”这个前提出发,运用几何公理,一步一步推出这个结论.这是演绎推理。,而一个习惯于统计思想的人,可能这样推理:做很多大小形状不一的等腰三角形,实地测量其底角,看差距如何,根据所得(su d)资料看看可否作出“底角相等”的结论.这样做就是归纳式的方法.,第四页,共二十八页。,问题:用局部观察对总体下结论,有没有片面性?结论(jiln)是否可靠?,显然这不仅依赖于进行局部观察的“样本”是否具有总体的代表性,也依赖于对从这些样本得到数据的合理(hl)加工、分析并得出论断.,事实上,如果一切都建立在可靠的科学基础(jch)上,则对总体下结论是可能的,也是可靠的.,但也应记住,毕竟是由“局部”推断“整体”,因而仍可能犯错误,结论往往是在某个“可靠性水平”之下得出的.,第五页,共二十八页。,概率论是数理统计的基础,而数理统计是概率论的重要应用(yngyng).但它们是并列的两个数学学科,并无从属关系。,学习数理统计(sh l tn j)无须把过多时间化在计算上,可以更有效地把时间用在基本概念、方法原理及方法适用对象的正确理解上.,国内外著名的统计软件包:SAS,SPSS,STAT等,都可以(ky)让你快速、简便地进行数据处理和分析.,第六页,共二十八页。,第四章 随机抽样(chu yn)和抽样(chu yn)分布,4.1 抽样(chu yn)的基本概念和方法,第七页,共二十八页。,一、总体(zngt)(Population)与个体(Sample),一个统计(tngj)问题总有它明确的研究对象.,总体(zngt)-研究对象的全体(或集合)。,总体,个体-总体中每个对象(或元素)。,每个个体具有的数量指标的全体就是总体.总体通常以一个概率分布描述。,第八页,共二十八页。,实例 研究某地区12岁儿童生长发育情况(qngkung),总体和个体应为什么?,显然,总体为该地区的全体儿童(r tng)个体为每一个儿童。,当然,衡量儿童生长发育情况要通过诸如身高、体重等数量指标进行(jnxng),所以对总体的研究实际上是对该地区的全体儿童的这些指标值概率分布进行(jnxng)研究。,第九页,共二十八页。,根据研究(ynji)指标的多少,总体分为一维总体-研究一项描述指标,常用随机变量X表示;多维总体-研究多项描述指标,常用随机向量表示,如二维总体(X,Y)。,根据含个体数量(shling)多少,总体分为有限总体和无限总体。,第十页,共二十八页。,二、简单(jindn)随机样本(simple random sample),研究(ynji)总体通常有两种方法:一是全面地观察统计(普查),二是从总体中抽取一部分个体观察统计(抽样)。,抽样(sampling)从总体(zngt)中抽取部分个体的过程。,样本(sample)在一维总体中,抽取得到的n个体。,样本容量(sample Size)样本中所含个体的数量。,第十一页,共二十八页。,注意:(1)一维总体(zngt)的每个个体的描述指标常用一个随机变量表达,所以容量为n的样本一般用n个随机变量X1,X2,Xn 表达。,(2)一维总体X的取值,是每个个体对应的指标数据x;而样本X1,X2,Xn的取值,是指每抽取一次样本所对应n个个体的指标数据,称为样本观察(gunch)值(简称样本值),记作x1,x2,xn。,第十二页,共二十八页。,总体(zngt)、样本、样本值的关系:,样本是联系(linx)二者的桥梁,第十三页,共二十八页。,简单随机样本在随机抽样中,与总体(zngt)X有相同概率分布,且相互独立的样本X1,X2,Xn。,简单(jindn)随机样本的性质:,1、随机性 Xi的取每个个体(gt)的概率相等。,2、独立性 X1,X2,Xn的相互独立,其样本观察值互不影响。,3、代表性 X1,X2,Xn与总体X有相同概率分布。,后面提到的样本如不说明,都是指简单随机样本。,第十四页,共二十八页。,一般地,对有限总体,应采用有放回抽样,对无限(wxin)总体(或数量较多),可采用无放回抽样(近似看作有放回),否则违背独立性。,简单(jindn)随机抽样具体实施的方法:抽签法随机数法,第十五页,共二十八页。,三、统计(tngj)量(Statistic),样本是对总体的代表和反映,抽样的目的是利用样本值对总体进行统计推断。而对总体进行统计推断,常根据需要的不同,利用样本构造一些包含所需要的多种信息(xnx)的量,就是关于样本X1,X2,Xn的一些函数,这些函数统称为统计量。统计量实际上表示样本的数字特征。,若X1,Xn为总体X的一个样本,g(X1,X2,Xn)是一个不包含任何未知参数的函数(hnsh),则g(X1,Xn)称为一个统计量。,统计量定义:,第十六页,共二十八页。,统计(tngj)量的特点:,(1)统计量是样本(yngbn)中n个随机变量X1,X2,Xn的函数,它是完全由样本决定的量,仍是一个随机变量。,(2)统计量不包含(bohn)任何未知参数。,第十七页,共二十八页。,几种(j zhn)常用统计量:,用于反映总体均值(jn zh)的信息,注意与总体数学(shxu)期望的区别和联系。,用于反映总体方差的信息,注意与总体方差的区别和联系。分母为n-1的原因:,第十八页,共二十八页。,第十九页,共二十八页。,SD与SE的区别(qbi):SD是描述个体观察值变异程度的大小,样本标准差越小,样本均数对一组样本观察值的代表性就越好;SE是描述样本均数变异程度和抽样误差的大小,样本标准误越小,用样本均数估计总体均数的可靠性就越高。在实际中,一般用样本标准差与样本均数结合,用于描述样本观察值的分布范围;样本标准误与样本均数结合,用于估计总体均数可能出现的范围。,五、变异系数 见课本(kbn)P49,P49案例(n l)4-1,第二十页,共二十八页。,四、常用(chn yn)抽样方法,抽样方法就是获取(huq)样本的方法。,1、单纯(dnchn)随机抽样,是一种等概率抽样,即总体中每个个体都有相等的机会被抽取。,对有限总体,应采用有放回抽样,对无限总体(或数量较多),可采用无放回抽样(近似看作有放回)。,第二十一页,共二十八页。,例:从某年级1000名学生抽查(chuch)100名调查上网情况,该法是其他抽样方法的基础。优点是均数及标准差(误)计算简单,且抽得的样本是简单随机样本;缺点是总体(zngt)量较大时,编号及随机抽取工作量大。,把学号后4位作为编号,做成签,充分混合后,从中摸出100个,则把这100位同学(tng xu)作为样本。或用微机随机产生。,常用实施方法:抽签法和随机数法。,第二十二页,共二十八页。,2、系统抽样(机械(jxi)抽样),按一定顺序和间隔从总体(zngt)中抽取样本的方法。步骤:编号 分段 确定起始编号 获取样本,例:从某年级1000名学生抽查(chuch)100名调查上网情况,该法优点是简单易行,样本观察值在总体中分布均匀;缺点是样本观察值总按一定周期趋势得到,易产生偏性。,可把学号的后4位作为编号,把个位数0-9做成签,充分混合后,从中摸1个数(如摸得6),则把这1000位同学中个位数字为6的100位同学作为样本。,第二十三页,共二十八页。,3、分层抽样,按某种特征将总体分成若干互不重叠(chngdi)组别、类型或区域等(称为分层),再从各层中随机抽样组成样本。,例:调查(dio ch)某校同学上网情况,该法要求各层间差异尽可能大,才能得到有较好代表性的样本(yngbn),并便于各层间分析比较。,可采用以年级分层抽样的方法,但上面例子则不适用,因差异较小。,第二十四页,共二十八页。,4、整群抽样(chu yn),先将总体(zngt)分成若干互不重叠部分(称为群),再从各群中随机抽取某群或几群作为样本。,例:调查某年级学生上网(shn wn)情况,该法适用于大规模调查,易于组织,节省人力物力,但误差较大,适于群体差异较小的调查对象。,可把每班作为一群,从中随机抽取一班或几班作为样本。,第二十五页,共二十八页。,5、多阶段(jidun)抽样,先将总体分成若干(rugn)互不重叠组,再将各组分成几个亚组,各亚组再分成几个小组等,每一分组看成一个阶段,然后在各阶段进行随机抽样。,实际中常(zhngchng)采用二阶段抽样。,注意:上述各种抽样方法中,只有单纯随机抽样抽得的样本是简单随机样本。而利用简单和非简单随机样本来推断总体的统计方法是不同的。,第二十六页,共二十八页。,小 结,1、基本概念:总体、个体、抽样、样本、样本 容量、样本值、简单随机样本、统计量。2、常用(chn yn)抽样方法及特点。3、几种常见统计量.,第二十七页,共二十八页。,内容(nirng)总结,数理统计学。(2)怎样利用试验观察的结果作出一个“好”的推断等。第一个问题是怎样进行抽样,使抽得的样本更合理,并有更好的代表性。(2)一维总体X的取值,是每个个体对应的指标数据x。,Xn的一些函数,这些函数统称为统计量。例:从某年级1000名学生抽查100名调查上网情况。常用(chn yn)实施方法:抽签法和随机数法。3、几种常见统计量.,第二十八页,共二十八页。,

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开