9.1.2
分层随机抽样、9.1.3
获取数据的途径1-2020-2021学年高一数学同步教学课件人教A版2019必修第二册
9.1
分层
随机
抽样
获取
数据
途径
2020
2021
学年
第9章 统计,9.1.2 分层随机抽样+9.1.3 获取数据的途径(1),分层随机抽样的概念及特点,1,分层随机抽样的概念及特点,1,分层随机抽样的概念,一般地,按一个或多个变量,把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起,作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配,分层随机抽样的概念及特点,1,分层随机抽样的概念,各部分之间有明显的差异,是选择分层随机抽样的依据,各层内可以采用简单随机抽样,相似的个体归入一类,即为一层,分层时要求每层的各个个体之间互不交叉,遵循不重复,不遗漏的原则.,将总体合理分层,分层随机抽样的概念及特点,1,分层随机抽样的特点,层与层的关系:分成的各层之间互不交叉;,适用范围:总体由差异明显的几部分组成;,各层比例:各层抽取的比例都等于样本量与总体容量的比;,可能性:是等可能抽样,每个个体被抽到的可能性相等;,样本:分层随机抽样充分利用了已知信息,使样本具有较好的代表性.,分层随机抽样的概念及特点,1,对分层抽样的层的理解,在分层抽样中,将具有某种共同特征的对象归为同一层,不同层之间的对象要有明显的差异,并且这些特征的差异应该是对所研究的问题有影响的.例如要从某中学抽取一些学生构成一个样本,如果研究他们的视力情况,那么应该按照年龄分层或按照年级分层,都是合理的分层方式.但如果按照性别分层就不合适了,因为性别对视力的影响的可能是很小的,如果研究他们对篮球运动的兴趣,那么按照性别分层就比按年龄分层或年级分层更合理.在实际中,对于一些复杂的问题。可能还需要对层内再进一步细分层.,分层随机抽样的步骤,2,分层随机抽样的步骤,2,求各层抽样数:按比例确定每层抽取个体的个数,分层,确定抽样比:抽样比=(为样本量,为总体容量),各层抽样:各层分别用简单随机抽样抽取个体,组成样本:综合每层抽取的个体,组成样本,=(为第 层中的个体数),分层随机抽样的步骤,2,各层抽样数由每层个体数占总体数量的比例确定,分层随机抽样中分多少层、如何分层、要视具体情况而定,总的原则是每层内个体的差异要小,不同层之间的个体的差异要大,且互不重叠,各层抽样按简单随机抽样进行,分层随机抽样的注意点,两种抽样方法的比较,3,两种抽样方法的比较,3,两种抽样方法的比较,3,简单随机抽样和分层随机抽样的区别与联系,分层随机抽样应用最广泛,它充分利用总体信息,得到的样本比简单随机抽样得到的样本更具有代表性,简单随机抽样是最基本的抽样方法,可应用于分层随机抽样中,简单随机抽样所得样本的代表性与个体编号无关,简单随机抽样是最简单最基本的抽样方法,在进行分层随机抽样时也要用到简单随机抽样,因此抽样方法经常交叉起来应用,分层随机抽样的平均数,4,分层随机抽样的平均数,4,总体平均数,在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为和,抽取的样本量分别为和,我们用,表示第1层各个个体的变量值,用,表示第1层样本的各个个体的变量值;用,表示第2层各个个体的变量值,用表示第2层样本的各个个体的变量值,则第1层的总体平均数和样本平均数分别为,分层随机抽样的平均数,4,总体平均数,在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为和,抽取的样本量分别为和,我们用,表示第1层各个个体的变量值,用,表示第1层样本的各个个体的变量值;用,表示第2层各个个体的变量值,用表示第2层样本的各个个体的变量值,第2层的总体平均数和样本平均数分别为,分层随机抽样的平均数,4,总体平均数,在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为和,抽取的样本量分别为和,我们用,表示第1层各个个体的变量值,用,表示第1层样本的各个个体的变量值;用,表示第2层各个个体的变量值,用表示第2层样本的各个个体的变量值,总体平均数和样本平均数分别为,分层随机抽样的平均数,4,总体平均数,在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为和,抽取的样本量分别为和,我们用,表示第1层各个个体的变量值,用,表示第1层样本的各个个体的变量值;用,表示第2层各个个体的变量值,用表示第2层样本的各个个体的变量值,在比例分类的分层随机抽样中,可以直接用样本平均数 估计总体平均数,即,=+=+=,获取数据的途径,在实际统计调查中,一般先要确定调查的目的对象及统计调查,要解决的问题和需要调查的总体还要确定好调查的项目,也就是要统计的变量,接下来就开始收集数据,收集数据的基本经如下:,通过调查获取数据:设计调查问卷调查问卷一般由一组有目的,有系统,有顺序的题目组成,问题由调查人员根据调查的目的、项目进行设计.设计调查问卷的注意事项:问题要具体有针对性,使受调查者能够容易作答;语言简单准确、含义清楚,避免出现有歧义或意思含混的句子;题目不能出现引导受调查者答题倾向的语句;设计问题时要注意如何得到敏感性问题的诚实回答,获取数据的途径,在实际统计调查中,一般先要确定调查的目的对象及统计调查,要解决的问题和需要调查的总体还要确定好调查的项目,也就是要统计的变量,接下来就开始收集数据,收集数据的基本经如下:,通过试验获取数据 根据调查项目的要求,设计一些合适的试验,能够直接的获得样本数据.试验时,要注意准备好试验用具或组织好观测的对象,指定专门的记录人员等.做试验通常能得到可靠的数据资料,但需花费的人力、物力、时间较多,有时带有破坏性,获取数据的途径,在实际统计调查中,一般先要确定调查的目的对象及统计调查,要解决的问题和需要调查的总体还要确定好调查的项目,也就是要统计的变量,接下来就开始收集数据,收集数据的基本经如下:,通过观察获取数据 对于有些现象不能用试验或者抽样等方法来获取数据,只能通过长久持续的观察获取.主要是一些自然现象,如地震、降水、大气污染、宇宙射线等.一般通过观察自然现象所获取的数据性质比较复杂,其中蕴含着所观察现象的本质信息,需要通过统计学理论和方法来挖掘,获取数据的途径,在实际统计调查中,一般先要确定调查的目的对象及统计调查,要解决的问题和需要调查的总体还要确定好调查的项目,也就是要统计的变量,接下来就开始收集数据,收集数据的基本经如下:,通过查询获得数据 有些数据资料不容易直接调查得到,这时可以通过查阅统计年鉴、图书馆文献等方法获得所需或相关的数据,比如全国历次人口普查的数据,都可以在统计年鉴中查阅到,还可以通过互联网上的资源得到数据资料.,THANKS,“,”,