GBT
17560-1998
数据的统计处理和解释
中位数的估计
17560
1998
数据
统计
处理
解释
中位数
估计
i c s 0 3.1 2 0.3 0A 4 1崛冒中 华 人 民 共 和 国 国 家 标 准 G B/T 1 7 5 6 0-1 9 9 8e q v I S O 8 5 9 5:1 9 8 9数据的统计处理和解释 中位数的估计I n t e r p r e t a t i o n o f s t a t i s t i c a l d a t a-Es t i ma t i o n o f a me d i a n1 9 9 8 门 1 一 1 0 发布1 9 9 9 一 0 7 一 0 1实施国 家 质 量 技 术 监 督 局发布G B/T 1 7 5 6 0-1 9 9 8目次前言 .皿I S O前言 。,。“1 范围 .I2 引用标准 “。13 定义和符号 .14 点估计 ,25 区间估计 。26 应用示例 。37 威尔考 克森符号秩 检验(W i l c o x o n s 咭 n e d r a n k t e s t)的中位数 估计方法 。5附录A(提示的附录)利用威尔考克森符号秩 检验(W i l c o x o n s i g n e d r a n k t e s t)估计中位数 6Gs/r 1 7 5 6 0-1 9 9 8前言 本标准等 效采用I S O 8 5 9 5:1 9 8 9 数据的 统计处理和解释 中位数的估计,与I S O 8 5 9 5 的主要差异如下:墓2 -a%2毛2 a/22 -a/22 a/2nz刀1曰艺间艺间1|夕les 办 改 曰艺间艺曰将一 2 增加了 一个没有截尾数据的 示例。3.增加了威尔 考克森符号秩检验(W i l c o x o n s i g n e d r a n k t e s t)的中位数估计方法。4 增加了对有 截尾数 据时的应用条件。5.删去了I S O 8 5 9 5:1 9 8 9中第 4章的内容。6 在编排 上有 变动。本标准的附录 A是提示的附录。本标准由全国 统计方法应用 标准化技术委员会提出 并归口。本标准 起草 单位:中国标准化与信息分类编码研究所、冶金部金属制品研究院、北京大学、中国科学院系统科学研究所和中国科技大学研究生院。本标准主要起草人:于振凡、刘琼、楚安静、孙山泽、马毅林、张建方、李仁良。cB/T 1 1 5 6 0-1 9 9 8I S O前言 I S O(国际标准化组织)是各个国 家标准化团体(I S O团体成员)组成的世界 性联合组织。研制国际标准的工作是通过I S O的各个技术委员会 进行的。每一个团体成员,对其感兴趣的问 题,有权参 与为 该课题而设立的有关技术委员会的工作。与I S O有联系的其他国际 性组织,包括官 方的和 非官方的,也可以参与这项工作。技术委员会制定的国际标准草案,在I S O理事会接受为国际标准以前发给团体成员.按照 I S O的程序,至少有7 5%的团体 成员投 票赞成 通过,这 些标准 草案才 能被批准为正式国 际标准。国 际标准I S O 8 5 9 5 由I S O/T C 6 9(统计方法 应用标准化技术委员会)起草制定。中华人 民 共 和国 国家 标 准数据的统计处理和解释 中位数的估计I n t e r p r e t a t i o n o f s t a t i s t i c a l d a t a-E s t i ma t i o n o f a me d i a n G B/T 1 7 5 6 0 一 1 9 9 8e q v I S O 8 5 9 5:1 9 8 91 范围 本标准给出了 通过在总体中随机抽取n 个样本单元,对总体概率分布的中 位数进行点估计和区间估计的程序。这些程序给出了一 个非参数 估计的 方法。本标准中 所描述的 方法对于任 何连续分布总 体都是适用 的。往:如果可以认为总体分布服从正态分布时,那么中位数就等于均值,其置信区间应根据G B 3 3 6 0 计算出;如果已 知总体概本分布函数,可采用其他方法估计中位数;只有对分布参数不甚了解的连续分布,才用此方法估计中 位 数。2 引用标准 下列 标准所包 含的条文,通过在本标准中引用而构成为本 标准的 条文。本标准出版时,所示版本均为有 效。所有标准 都会被修订,使用本标准的各 方应探讨使用下列标准 最新版本的 可能 性 G B/T 3 3 6 0-1 9 8 2 数据的统计处理和解释 均值的估计 和置信区 间(e q v I S O 2 8 5 4:1 9 7 0 G B/T 3 3 5 8.1-1 9 9 3 统计学术语 第一部 分:一般统 计术语 G B/T 3 3 5 8.2-1 9 9 3 统计学术语 第二部 分:统计质量控制术 语定义和符号3.1 定义 本标准采用了G B/T 3 3 5 8.1-1 9 9 3 和 G B/T 3 3 5 8.2-1 9 9 3 中的定义。31.1 估计 s t i m a t i o n 根据样本推断未知的总体分布参数。(G B/T 3 3 5 8.1-1 9 9 3 中3.3 9)3.1.2 估 计 量 e s t i m a t o r 用以估计总体分布未知参数的统计量。(G B/T 3 3 5 8.1-1 9 9 3 中3.4 0)3.1.3 估 计 值 e s t i m a t e 根据样本观测值,对估计量计算的结果。(G B/T 3 3 5 8.1-1 9 9 3 中3.4 1)3.1.4双 侧置 信 区 间 t w o-s i d e d c o n f id e n c e i n t e r v a l 若0 是要估计的总体分布未知量,T。和T:是两个统计量(T 镇7,2),使区间口.、,T J 以一定概率包含0,则称此区间 是0 的一个双侧置信区间。T:和T,分别称为 置信区间的上、下限。(G B/T 3 3 5 8.1-1 9 9 3中 3.4 7)3.1.5单 侧 置 信区 间 o n e-s i d e d c o n f i d e n c e i n t e r v a l 在置信区间口 i,T z 中.当上限了,为co,或未知量的上限;或者下限 T 为一二或未知量的下限时,国 家 质 最 技未 监 落 局1 9 9 8-1,一 柏批 准1 9 9 9-0 7 一。,实 施 1G B/T 1 7 5 6 0 一1 9 9 8称该置信区间为单侧置信区间。此时,对于前者,T 称为置信下限;对于后者,T,称为置信上限。(GB/T 3 3 5 8.1-1 9 9 3 中 3.4 8)3.1.6 置 信 水 平,置 信 度 c o n f id e n c e l e v e l C T,1 z 是 B的一 个双侧 或单侧置信 区间,1-a是。和 1之 间的常数,若对 一切 B,有P(T簇。簇 T.,)l-a,则称1 一。为 该置 信区间的 置信水平。当P(T,(B T 2)=1-a 时,1-a 也称为 置信系数或置信度。(G B/T 3 3 5 8.1-1 9 9 3 中3.4 9)3.1.7 次序统计量 o r d e r s t a t i s t i c s 将样本的各分量按从小到大顺序排列成X(u,S(v,.,r(.),称(二(u),二。,,z(.)为次序统计量,z称为第i 个次序统计量(G B/T 3 3 5 8.1-1 9 9 3 中3.2 4)3.1.8 连续概率分布的中位数M 或二。m e d i a n o f a c o n t in u o u s p r o b a b i l i t y d i s t r i b u t i o n 当总体分布是连续分布 F(二)时,中位数是使得 F(M)=1/2的数值M,在本标准中M 叫作总体中位数。3.2符号 本标准采用7 G B/T 3 3 5 8.1-1 9 9 3 和 G B/T 3 3 5 8.2-1 9 9 3中的定义和符号:F(二)分布函 数在二 处的值 M总体中位数 样 本量(G B/T 3 3 5 8.1-1 9 9 3 中3-7)P二项分布参数 T,置 信区间的下限 I :置信区间的 上限 二(l 第i 个次序统计量的值 标准正态分布的1-a分位数 标准正态分布的1-a/2 分位数 1-a置信水平(GB/T 3 3 5 8.1-1 9 9 3 中3.4 9)Q点估计总体中位数 M的点估计由样本中位数给出。当 n为奇数时M的点估计值为:弓 x 侧 2+二,_,当 n为偶数时区间估计5.1 M的置信区间 总体中位数 M 的双侧置信区间是一个形如 T T:的闭区间.这里T,GT=;T:和 T:分别称为置信区间的上、下限 单侧置信区间是 T,,二)或(一 二.T _ ,对于前者,T,称为 置信 下限;对于后者,T z 称为 置信上限。l1 1 的置信区间的实际含义是使此区间以一定概率包含中位数M,5.2 通用方法 置信水平为1-a 的双侧置信区间的上、下限是由 一对次序统计量仁 二。,_,-。十 1 给出的,这里整数k由以下两式确定:套(一(2a/2 。.。.(1)G B/T 1 7 5 6 0 一1 9 9 8言()卜 2a/2(2)单侧的情形应以a 代替a/2,注:这徉定出的置信区间,其确切的置信系数一般略大于 1-n,除非上述第一式的等号成立时。表 1给出了当 S G 置信上限由下式给出:T,=T,-,这里二 1,a、二,。一,二 是样本中 的次序统计量。当样本量n 值太小时.不能确定合适的置信限。5.3 近似的方法 对于 表 1 中没 给出 的n 值,k 的 近似值可由下 列公式给出:y=0.5(n+1 一“Vn 一 0.5)(3)k 是.v 的整数部分,。是由下 式确 定的 标准正态分布的分位数:单侧限的情形:u=u,-,;双侧限的情形:u=u,_,i 2,对于通常的a 值,此近似值是相当准确的。若使用计算机程序时,如 果n(3 0,用公式(4)计算出的值与表1 相一致。当n 3 0,用公式(4)计算出的值与用公式(3)计算出的值相一致。.v二0.5 伽 十 1 一u+/n十0.5一0.2 5 u 2).(4)k是y的整数部分。6应用示例6.1 当 5 n-3 0 时 在 一 项 寿 命 加 速 试 验中,在 一 批 晶 体 管 中 抽 取3 4 个,其 使 用 寿 命 数 据 值 如 下:(单位:星 期)(其 中 打“,”号三个数据是截尾数据)3,4,5,6,6,7,8,8,9,9,9,1 0,1 0,1 1,1 1,1 1,1 3,1 3,1 3,1 3,1 3,1 7,1 7,1 9,1 9,2 5,2 9,3 3,4 2,4 2,5 2,5 2,5 2 .5 2 寿命中位数的点估计为:(sa n+s a e,)/2 二(1 3+1 3)/2=1 3 样本量n 3 0,为了 得到置信水平为。.9 5 的M的中 位数单侧置信区间的下限,使用近似的方法。由于 1-a=0.9 5 u=u,_,=u-s=1.6 4 5,所以 y=0.5(n+l-u,fi n-0.5)=0.5(3 4+1 一1.6 4 5/3 4 一0.5)=1 2.7 4 k 是y 的整数部分,因此k=1 2。于是得置信下限T,=s c,z,=1 0,对 置 信水 平 为0.9 5 的M的 双 侧 置 信 区 间 的 上、下 限,由 于1-a=0.9 5,1-a/2=0.9 邓,u=u,-a n=a.s 7:二1.9 6 0,所以 y 一 0.5(n+l 一。丫 n-0.5 一 0.5(3 4+1 一 1.9 6 0,/丽 二 石 丁 引 =1 1.8 3 取k=l l,n-k+1=3 4 一1 1+1=2 4.于是得M的双 侧置信区间 T L,T,卜 s a u+s a+=9,1 9 注:本例中的数据是由Wi l k等人所做的试验提供的.GE/T 1 7 5 6 0一 1 9 9 8表 1 作为n的函数的k值表单侧限的情形双侧限的情形刀 置信水平 一 置信