温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
GBT
4882-2001
数据的统计处理和解释
正态性检验
4882
2001
数据
统计
处理
解释
正态性
检验
t c s 0 3.1 2 0.3 0A 4 1G 8中 华 人 民 共 和 国 国 家 标 准 c s/T 4 8 8 2-2 0 0 1i d t I S O 5 4 7 9:1 9 9 7数据的统计处理和解释 正态性检验S t a t i s t i c a l i n t e r p r e t a t i o n o f d a t a-N o r ma l i t y t e s t s2 0 0 1 一 0 3 一 0 5发布2 0 0 1 一 0 9 一 0 1实施国 家)贡董 技 术 业 督 局发布GB/T 4 8 8 2-2 0 0 1目次前言 I S O前言 NI S O引言 “,.N1 范围 12 引用标准 13 定义与符号 。,.14 总则 ,35 图方法 。36 有方向检验 97利 用b 和b。的 联 合 检 验(多 方 向 检 验).1 28 无方向检验 。1 29 使用几组独立样本的联合检验 1 71 0 统计用表 。1 9附录A(提示的附录)空白的正态概率纸 2 8附录B(提示的附录)参考文献 .2 8G B/T 4 8 8 2-2 0 0 1前言 本标准等同采用国际标准 I S O 5 4 7 9:1 9 9 7 数据的统计处理和解释偏离正态分布的检验。本标准代替国家标准GB/T 4 8 8 2-1 9 8 5。本标准与G B/T 4 8 8 2-1 9 8 5 相比,在检验方法方面的不同之处有:对图方法作了一些改进;增加了 利用几组独立样本的 联合检验,它实际上是一种修改的夏皮洛一威尔克(S h a p i r o-Wi l k)检验;删去了无方向检验中的D检验方法,代之以爱泼斯 一普利(E p p s-P u l l e y)检验方法。本标准的附录A,附录B为提示的附录。本标准于1 9 8 5 年 1 月 2 9日首次发布。本标准由全国统计方法应用标准化技术委员会提出并归口。本标准由华东师范大学、中国标准研究中心、北京大学等单位起草。本标准主要起草人:梁小摘、孙山泽、茹诗松、刘文。GB/T 4 8 8 2-2 0 0 1I S O前言 I S O(国际 标准化组织)是由 各国 标准化团体(I S O成 员团体)组成的 世界性的 联合会。制定国际标准的工作,通常由I S O的技术委员会完成,各成员团体若对某技术委员会的工作感兴趣,均有权参加该委员会。与 I S O保持联系的各国际组织(官方的或非官方的)也可以参加有关工作。在电工技术标准化方面,I S O与国际电工委员会(I E C)保持密切合作关系。由技术委员会采纳的国际标准草案提交各成员团体投票表决,需取得至少 7 5 写参加表决的成员团体的同意才能作为国际标准正式发布。国际标准I S O 5 4 7 9 是由I S O/T C 6 9/S C 6 统计方法应用技术委员会测试 方法与结果分 委员会制订的。本国际标准的附录 A、附录B仅供参考。I S O引言 国际标准中推荐的许多统计方法。如I S O 2 8 5 4 中描述的那些方法.有一个基本的假定:在这些方法中涉及的随机变量具有独立的正态分布,分布的一个或两个参数可以是未知的。这就引出了一个问题,为了能可靠地应用那些国际标准提供的方法,由样本代表的分布是否充分接近正态分布?在任何情况下,这个问题都不能简单地用“是”或“否”来回答。因此,发展了大量的“正态性检验”方法,这些方法中的每一个方法对所考虑的分布的某一特征(如偏度、峰度)或多或少是灵敏的。一般,使用的检验是对应于某种预先确定的风险设计的,此风险即如果正态性是真时被拒绝(第一类错误)。另一方面,当假设不真时,除非备择假设被明确地给定,原假设未被拒绝(第二类错误)的概率是不能确定的。然而明确给定备择假设通常是不可能的。因此,需要计算结果。对某一特殊的检验,如果样本量较小,这个风险会特别大。中 华 人 民 共 和 国 国 家 标 准数据的统计 处理和解释 正态性检验S t a t i s t i c a l i n t e r p r e t a t i o n o f d a t a-No r ma l i t y t e s t s G B/T 4 8 8 2-2 0 0 1i d t I S O 5 4 7 9:1 9 9 7代替GB/T 4 8 8 2-1 9 8 5范 围1.1 本标准在假定观测值相互独立时,对决定分布是否为正态的假设应否被拒绝的方法和检验,给出了一个导引。1.2 当对观测值是否服从正态分布存在疑问时.使用偏离正态分布的检验是有用的,甚至是必须的。利用1 检验检查一个随机观测样本的均值是否偏离给定的理论值,就是这种情况的一个例子。然而,在稳健方法(即观测值的真实的概率分布不是正态时,结论仅有轻微的变化)的情况下,偏离正态分布的检验并不是非常必要的。1.3 涉及基于正态性假设的统计方法时,也并非严格地必须使用这样一个检验。观测值的正态分布可能是完全没有疑问的,可以是理论的(如物理的)原因构成了这个假设,也可以是根据先验信息接受了这个假设。1.4 本标准中偏离正态分布的检验是针对非分组的原始数据,而不是分组数据。检验也不适用于截尾数据。1.5 本标准中偏离正态分布的检验可以应用于观测值,也可以应用于它们的函数,如取对数、平方根等。1.6 当样本容量小于 8 时,偏离正态分布的检验效果是非常差的。因此,本标准限制样本量至少为 8,2引用标准 下列标准所包含的条文,通过在本标准中引用而构成为本标准的条文。本标准出版时,所示版本均为有效。所有标准都会被修订,使用本标准的各方应探讨使用下列标准最新版本的可能性。G B/T 3 3 5 8.1-1 9 9 3 统计学术语第一部分一般统计术语3定义与符号 定义在G B/T 3 3 5 8.1 中的 定义适用于本标准。符号 夏皮洛一威尔克检验的系数A爱泼斯一普利检验的辅助量b,(即国际标准中的b 2)样本峰度 卿国 际 标 准 中 的 石)样 本 偏 度国家质f技术监督局2 0 0 1 一 0 3 一 0 5批准2 0 0 1 一 0 9 一 0 1实施 1G s/T 4 8 8 2 一2 0 0 1BEq从私k礼nP尸PST踢脚劝W叭XX2 u 2(k)TaRY A凡一3况yy(于氏E(nl爱泼斯一普利检验的辅助量期 望利用几组独立样本的联合检验的辅助量利用几组独立样本的联合检验的样本组数零假 设备择假设在按非降次序排列的样本内,观察值 z的个数样本i 阶中心矩样本量与分布的 户分位数相联系的概率概率与Xu,相联系的概率夏皮洛一威尔克检验的辅助量检验统计量爱泼斯一普利检验的检验统计量标准正态分布的户分位数利用几组独立样本的联合检验的辅助量夏皮洛一威尔克检验的检验统计量利用几组独立样本的联合检验的辅助量X 的值随机变量在按非降次序排列的样本中,样本的第1 个值在按非降次序排列的样本中,样本的第k 个值算术平均显著性水平(犯第一类错误的概率)犯第二类错误的概率(即国际 标准中的R=)总体的峰度总体的峰度相对于正态分布而言的超出量(即 国 际 标 准 中 的 而)总 体 的 偏 度利用几组独立样本的联合检验的辅助量利用几组独立样本的联合检验的系数利用几组独立样本的联合检验的辅助量利用几组独立样本的联合检验的系数利用几组独立样本的联合检验的辅助量利用几组独立样本的联合检验的系数总体的期望总体的方差总体的3阶中心矩总体的4阶中心矩总 体 的 标 准 差(一 汽),禹J.呀产产产口GB/T 4 8 8 2 一 2 0 0 14总则4.1 检验偏离正态分布有多种方法。在本标准中有图方法、矩检验、回归检验和特征函数检验。丫拟合优度检验仅适用于分组数据,由于分组会损失信息,本标准不考虑这种检验。4.2 如果没有关于样本的附加信息可以利用,则建议先做一张正态概率图。也就是在正态概率纸上画出观察值的累积分布函数,正态概率纸上的坐标轴系统使正态分布的累积分布函数呈一条直线。在第 5 章中描述了这一方法。它让人们立即看到观测的分布是否接近正态分布。有了这种进一步的信息,可决定是进行一个有方向检验,还是进行回归检验或特征函数检验,或者不再检验。另外,这样的图示虽然不能作为一个严格的检验,但它提供的直观的信息,对于任何一种偏离正态分布的检验都是一种必要的补充。在拒绝零假设的情形,按这些信息的意义,常常可以看出恰当的备择假设的类型。4.3 一个偏离正态分布的检验是对如下的零假设所作的检验:组成样本的,个独立观测值来自同一正态分布。检验包含计算一个称为检验统计量的观测值的函数 T,正态分布零假设拒绝与否,取决于T的值是否落在与正态分布对应的期望值附近的一个集合中。4.4 检验的拒绝域是导致拒绝零假设的T值的一个集合。检验的显著性水平是一个概率,它是当零假设正确时,T值落人拒绝域的概率。这个水平给出了错误地拒绝零假设(犯第一类错误)的概率。拒绝域的边界(在双侧检验时,拒绝域的两侧边界)是检验统计量的临界值。4.5 检验的功效是当零假设不真时,拒绝零假设的概率。功效高意味着错误地不拒绝零假设(犯第二类错误)的概率低。应该强调,检验的功效(即正态分布零假设是错误时,零假设被拒绝的概率)会随观测数的增多而增大。例如,当使用某一个偏离正态分布的检验时,在大的样本下,检验出与正态分布有偏离是容易的,而同一检验在较少的观测值下可能检验不出偏离。4.6 偏离正态分布的检验根据备择假设的不同可分为两种。当在备择假设中指定对正态分布偏离的形式时,检验称为有方向检验。当在备择假设中未指定对正态分布偏离的形式时,检验称为无方向检验。在有方向的检验中,确定拒绝域应使检验的功效尽可能地大。在无方向的检验中,拒绝域包含检验统计量远离其在零假设下希望的值的那些值。如果关于偏离正态分布的形式的假设已有设定,例如与正态分布具有不同的偏度或峰度,应该使用有方向检验,因为这样的检验的功效一般比无方向检验高。4.7 注意:有方向检验基本上是单侧的。例如,在偏度的情形,它或是正偏或是负偏。然而,当几个备择假设联合考虑时,检验是多方向的,当非零偏度和不同于正态分布的峰度一起考虑时,就是这种情况。4.8 表 s 至表 1 4及图9 允许检验在最常用的a 水平,即a=0.0 5 和 a=o.0 1 下执行。显著性水平必须在执行检验前给定。注意检验可能产生这样的结果,在 0.0 5 水平下拒绝零假设.而在。.0 1 水平下不拒绝这同一个零假设。4-9 在计算检验统计量时,必须至少保持 6 位有效数字。部分和、中间结果和辅助量的归整不应少于 6位有效数字。5图方法5.1 在正态概率纸上画出观测值的累积分布函数。这种概率纸,一个坐标轴(在本标准中为纵轴)的刻度是非线性的,它是按标准正态分布函数的值刻画的,对具体数据则标出其累积相对频率的值。另一个坐标轴刻度是线性的.顺序标出x的值。正态变量x的观测值的累积分布函数应近似一条直线。有时这两个坐标轴被相互对调。另外.如果对变量x作了一个变换,线性刻度可以变成对数、平方、倒数或其他刻度。图 1 给出了一张正态概率纸。在纵轴上累积相对频率的值是百分数,而横轴是线性刻度。附录A提供了一张空白的正态概率纸。Gs/r 4 8 8 2 一2 0 0 1 如果在正态概率纸上所绘的点散布在一条直线附近,则它对样本来 自正态分布提供了一个粗略的支持。而当点的散布对直线出现系统偏差时,这个图可提示一种可供考虑的分布类型。这种方法的重要性在于它容易提供对正态分布偏离的类型的视觉信息。如果图形显示数据是来 自 某种形状的分布(如图 5 或图 6中所显示的累积分布函数图),数据的某种变换可能导致正态分布。如果图形显示数据不是来 自一个简单的单一分布,而是来自两个或多个单一子总体的混合(如图 7显示的累积分布函数图),则建议先识别这些子总体,再分别分析每一个子总体。必须注意,这样一张图从严格意义上来说并不是一个检验偏离正态分布的方法。在小样本场合,表示的曲线可能呈现为正态分布,但是,在大样本场合,一些不显眼的曲线也可能是非正态