第二
随机变量
及其
分布
函数
第二章第二章 随机变量及其分布函数随机变量及其分布函数 1 第一节第一节 随机变量随机变量 概率论是从数量上来研究随机现象内在概率论是从数量上来研究随机现象内在规律性的,为了更方便有力的研究随机现象,规律性的,为了更方便有力的研究随机现象,就要用数学分析的方法来研究,因此为了便就要用数学分析的方法来研究,因此为了便于数学上的推导和计算,就需将任意的随机于数学上的推导和计算,就需将任意的随机事件数量化当把一些非数量表示的随机事事件数量化当把一些非数量表示的随机事件用数字来表示时,就建立起了随机变量的件用数字来表示时,就建立起了随机变量的概念概念 2 实例实例1 1 在一装有红球、白球的袋中任摸一个在一装有红球、白球的袋中任摸一个球球,观察摸出球的颜色观察摸出球的颜色.S=红色、白色红色、白色 非数量非数量 将将 S 数量化数量化?可采用下列方法可采用下列方法 S红色红色 白色白色()XR103 即有即有 X(红色红色)=1,1,()0,.X红色白色X(白色白色)=0.这样便将非数量的这样便将非数量的 S=红色,白色红色,白色 数量化了数量化了.4 实例实例2 2 抛掷骰子抛掷骰子,观察出现的点数观察出现的点数.,3)3(,2)2(,1)1(XXX,6)6(,5)5(,4)4(XXX).6,5,4,3,2,1(,61 iiXPS=1,2,3,4,5,6 样本点本身就是数量样本点本身就是数量 恒等变换恒等变换 且有且有()X则有则有 5 通常用字母表后的大写字母ZYX,等表示随机变量,其可能的取值用小写字母zyx,等表示 如果随机变量的所有可能取值是有限的或者是可列无穷的(可以表示成一个数列),则称它为离散离散型随机变量型随机变量如果随机变量的可能取值可以充满整个区间,则称它为连续型随机变量连续型随机变量 定义定义 2.1.12.1.1 设随机试验的样本空间是S,如果)(XX 是定义在样本空间S上的实值函数,即对于每一个S,总有一个确定的实数()X与其对应,则称)(XX 为随机变量随机变量 6 例例2.1.1 从一批产品中随机抽取10个进行检验,其中含有的废品数是一个随机变量,它的所有可能取值是0,1,10,因此它是一个离散型随机变量.例例2.1.2 某商店在某天的顾客数是一个随机变量,它的所有可能取值是0,1,,因此它是一个离散型随机变量.例例 2.1.3 某品牌的电视机的寿命X是一个随机变量,它的所有可能取值是,0,因此它是一个连续型随机变量.7 用随机变量表示随机事件用随机变量表示随机事件 例如,若我们用 X 表示某台电视机的寿命,并且规定寿命超过 10000 个小时的电视机为合格品,则该电 视 机 为 合 格 品 这 一 事 件 就 可 以 表 示 为10000X;又如,由两个人负责维修 10 台机器,设 X 为同时出故障的机器数,则机器出故障而来不及维修这一事件可以表示为2X;再如,设 X,Y分别表示甲乙两队在一场篮球对抗赛中的各自的得分,则甲获胜这一事件可以表示为XY;等等.8 2.2 离散随机变量的概率分布律离散随机变量的概率分布律 如果随机变量X的所有可能取值是有限的有限的或者是可可列无穷的列无穷的(可以表示成一个数列),则称X为离散型离散型随机变量随机变量 对于离散型随机变量,关键是要确定:1 1)所有可能的取值是什么?)所有可能的取值是什么?2 2)取任一可能值的概率是多少?)取任一可能值的概率是多少?2.2.1 分布律分布律 9 定义定义 2.2.1 设离散型随机变量X的所有可能取值为12,kx xx,则称()iipP Xx,1,2,in 为 X 的概率分布概率分布或分布分布律律.离散型随机变量的分布律也可表示为 XPnxxx2112nppp1212kkxxxXppp或记为 10 分布律的基本性质分布律的基本性质(1)非负性:非负性:0,1,2,;ipi(2)规范规范性性:11.iip 这两个性质也是判断一个数列12,kp pp能否成为某个随机变量的分布律的充分必要条件充分必要条件.11 例例 2.2.1 已知随机变量X的分布律是 23kP Xkc,1,2,3,k 求(1)常数c;(2)2521 XP.解解(1)由分布律的性质,有 1122/32131 2/3kkkkpccc 解得,21c )21(2521XXPXP95)2()1(XPXP(2)12 解解 X的可能取值为m,2,1,0,且事件Xi意味着总共取了 i+1 次球,其中最后一次取的是黑球而前面 i 次取得都是白球.例例 2.2.2 一只口袋中有m只白球,mn 只黑球.连续无放回地从这口袋中取球,直到取出黑球为止设此时取出了X只白球,求X的分布律.记kA 第 k 次取的是白球,于是 121iiXiA AA A由概率的乘法公式,有 1111211()(|)(|)(|)()iiiiP XiP AAA P AAAP AA P A1111nm mimmni ninn 1,2,im13 例例 2.2.3 掷一个不均匀的硬币,出现正面的概率为p10 p,设X为投掷到正反面均出现为止时所需掷的次数,求X的分布律.解解 X的可能取值为,3,2n,记iA表示掷第i次硬币时出现正面,则事件12,nA AA相互独立,且 nnnnAAAAAAnX1111所以 11)(nnpqqpnXP即X的分布律为 X 2 3 n P pp12 22pqqp 11nnpqqp 14 2.2.2 二项分布二项分布 定义定义2.2.2 如果随机变量X的分布律为 1n kknP Xkppk nk,2,1,0则称 X 服从参数为参数为 n,p 的二项分布的二项分布,记作,Xb n p或pnBX,.二项分布的背景是伯努利试验二项分布的背景是伯努利试验:如果每次试验中事件A发生的概率均为p,则在n重伯努利试验中A发生的次数服从参数为n,p的二项分布。15 0-1分布或两点分布分布或两点分布 注:当n=1时的二项分布B(1,p)称为0-1分布。若X的分布律为 1,0,)1(1kppkXPkk或者 0 1 XPp1p则称随机变量X服从参数为参数为p的的0 0-1 1分布或两点分布分布或两点分布.16 例例 2.2.4 投掷一个均匀骰子n次,求(1)恰好得到一个 6 点的概率;(2)至少得到一个 6 点的概率;(3)为了以 0.5 的概率保证至少得到一个 6 点,则至少要投掷几次?解解 设X表示掷一个均匀骰子n次出现 6 点的次数,则,1/6Xb n.(1)11155(1)1 666nnnnnP X (2)0(1)1(XPXPn651(3)21651n欲使 必须 8.35ln6ln2lnn所以至少要投掷4次.17 例例 2.2.5 一种生物试验的费用比较昂贵,而每次试验取得成功的概率为 0.4.如果试验者希望以 0.95的概率至少取得一次成功,则至少应做几次试验?解解 设至少应做n次试验,X表示n次试验中取得成功的次数,则,0.4Xb n.因为)0(1)1(XPXP95.06.01n所以 86.56.0ln05.0lnn即至少应做6次试验.18 例例2.2.62.2.6 某人进行射击,设每次击中的概率均为0.02,独立射击400次,试求至少击中两次的概率。解解 将每次射击看成是一次试验,设击中的次数为X,则)02.0,400(BX所以有 1012XPXPXP399400)98.0)(02.0(400)98.0(1 直接计算上式比较麻烦,为此需要一个近似计算公式。19 2.2.3 泊松分布泊松分布 一、泊松分布一、泊松分布 若离散型随机变量X的分布律为:e!kP Xkk,2,1,0k 其中参数0,则称随机变量X服从参数为参数为的的泊松分布泊松分布,记作 PX.实例:实例:1)普鲁士骑兵每年被马踢死的人数服从参数为0.61的泊松分布;2)1500年到1932年之间每年发生战争的次数(规模超过50000人)服从参数为0.69的泊松分布。20 泊松分布是一个非常常用的分布律,它常与单位时间、单位面积等上的计数过程单位时间、单位面积等上的计数过程相联系.例如一小时内来到某百货公司中顾客数一小时内来到某百货公司中顾客数、单位单位时间内某电话交换机接到的呼唤次数时间内某电话交换机接到的呼唤次数和布匹布匹上单位面积的疵点数上单位面积的疵点数等随机现象都可以用泊松分布来描述.附表 2 给出了不同值对应的泊松分布函数的值.21 记(;)e!kP kk,则(;)(1;)P kP kk于是,若不是正整数,则当 k时,(;)P k随k递增;当 k时,(;)P k随k递减;当 k时(;)P k达到最大值.若是正整数,则当k时,(;)(1;)P kP k,即(;)P k在k和1k处取得最大值.泊松分布的取值规律泊松分布的取值规律 22 泊松定理泊松定理 定理定理 2.2.1(泊松定理泊松定理)假设在n重贝努里试验中,随着试验次数n无限增大,而事件出现的概率np无限缩小,且当n时有nnp,则 lim(1)!kkn knnnnppekk 23 泊松定理表明,当n很大(一般不小于20)p很小(一般不大于0.05)时,二项分布可近似的用泊松分布来表示.这实际上也就表明了大量试验中稀有事大量试验中稀有事件发生的次数可以用泊松分布来描述件发生的次数可以用泊松分布来描述.由于泊松定理是在nnp条件下得到的,所以在计算二项分布有关概率时,当n很大,p很小,而np大小适中时,可以用下列近似公式:(1)!kkn knppekk 泊松定理的含义泊松定理的含义 24 续例续例2.2.6 现在我们运用泊松定理来做近似计算,由于此时,02.0,400pn故 8np,于是 880e,18eP XP X因此 8821 e8e0.997P X 该例题表明,即使是一个命中率很低的射手,在大量的射击中至少击中两次或两次以上概率还是很大的.因此在大数次的试验中在大数次的试验中,不能忽略小概率事件不能忽略小概率事件.25 例例2.2.72.2.7 为了保证设备正常工作,需配备适量的维修工人(工人配备多了浪费,配备少了又要影响生产),现有同类型的设备300台,各台工作是相互独立的,发生故障的概率都是0.01.在通常情况下一台设备的故障可由一个人来处理(我们也只考虑这种情形),问至少需配备多少工人,才能保证当设备发生故障但不能及时维修的概率小于0.01?解解 设需配备N人,记同一时刻发生故障的设备台数为X,则 XB(300,0.01).所需解决的问题是确定最小的N,使得 0.01P XN由泊松定理 ,有)3(np3130.01!kk NeP XNk 查表知,满足上式最小的N是8.因此,为达到上述要求,至少需配备8个工人.26 例例2.2.82.2.8 设有80台同类型设备,各台工作是相互独立的,发生故障的概率都是0.01,且一台机器的故障能由一个人处理.考虑两种配备维修工人的方法,其一是由4人维修,每人负责20台;其二是由3人共同维修80台.试比较这两种方法在设备发生故障时不能及时维修的概率的大小.解解 先考虑第一种方法 以 X 表示第一个人维护的20台机器中同一时刻发生故障的台数,则 XB(20,0.01).于是,第一个人来不及维修的概率为 1012XPXPXP0169.0)99.0)(01.0(20)99.0(1192027 设A为“四个人中至少有一个人来不及维修”这一事件,则有 0169.02)(XPAP 以 Y 表示3个人共同维护的80台机器中同一时刻发生故障的台数,则 YB(80,0.01).于是他们来不及维修的概率为 4P Y 0.84(0.8)e0.00908()!kkP Ak(0.8)np按第二种方法按第二种方法效率更高!效率更高!再考虑第二种方法 28 例例2.2.9 设在时间t分钟内通过某交叉路口的汽车数服从参数与t成正比的泊松分布.已知在一分钟内没有汽车通过的概率为0.2,求在2分钟内多于一辆车通过的概率.解解 设 tX是在时间t分钟内通过某交叉路口的汽车数,则 tPtX,其 中是 比 例 常 数.又 已 知 2.001XP,而 PX1,所以