《泊松分布的应用.docx》由会员分享,可在线阅读,更多相关《泊松分布的应用.docx(7页珍藏版)》请在第壹文秘上搜索。
1、泊松分布的应用泊松分布的应用摘要泊松分布是指一个系统在运行中超负载造成的失效次数的分布形式。它是高等数学里的一个概念,属于概率论的范畴,是法国数学家泊松在推广伯努利形式下的大数定律时,研究得出的一种概率分布,因而命名为泊松分布。作为一种常见的离散型随机变量的分布,泊松分布日益显示其重要性,成为概率论中最重要的几个分布之一。服从泊松分布的随机变量是常见的,它常与时间单位的计数过程相联系。在现实生活中应用更为广泛,如数学建模、管理科学、运筹学及自然科学、概率论等等。并且在某些函数关系起着一种重要作用。例如线性的、指数的、三角函数的等等。本文对泊松分布产生的过程、定义和性质做了简单的介绍,研究了泊松
2、分布的一些性质,并讨论了这些性质在实际生活中的重要作用。关键词:泊松过程;泊松分布;定义;定理;应用;一、计数过程为广义的泊松过程1.计数过程设X=N(t),tT=0,8)为一随机过程,如果N(t)是取非负整数值的随机变量,且满足S0,称为过程NQ)的强度。(4)对于充分小的At亦即对于充分小的加,在(,1+4)或2个以上质点的概率与出现一个质点的概率相对可以忽略不计。了解泊松过程,就很容易去了解泊松分布的相关性质,其实泊松分布就是在泊松过程当中每单位的时间间隔内出现质点数目的计数。二、泊松分布的概念:泊松分布常用于描述单位时间、单位平面或单位空间中罕见“质点”总数的随机分布规律。定义1设随机
3、变量X的可能取值为0,12,且尸乂=公=2=0,1,2,.,/10为常Ar!数。那么称X服从参数为人的泊松分布,记作XP(入)。定义2设是任意一个随机变量,称中(。=/(-8。小)是的特征函数。主要结论:定理1如果X是一个具有以人为参数的泊松分布,那么E(X)=入且D(X)=0证明设X是一随机变量,假设EX-RX)f存在,那么称它为X的方差,记作D(X),即D(X)=EX-RX)。设X服从泊松分布P(X),即有:op2kco那么Ex)=ek-ejvHeTe=%人=o欠!人=I(Z-IPke = 2 + /、8/830从而EQ)=1%=1+A=O长k=2乙bA=ID(X)=E(X2)-EX)2=
4、22+2-22=2定理2设随机变量Xn(n=1,2,)服从二项分布,其分布律为Pxnk=UPnd-pnk,k=0,1,2,-,Ho又设枕=20是常数,那么IimPxtl=k=-eo00k!证明由即“=H得:显然,当k=0时,故Pxl=kfe-鼠当k21且kf8时,有从而Px=ke,故IimPxnk=e。kn定理3设p是服从参数为的泊松分布的随机向量,那么:证明”的特征函数为八)=M,故以=(成/71的特征函数为:对任意的t,有e五=1+-*+o()oV2!Jit2z-2于是41iyJt=F,(-)0I2)2I2从而对任意的点列片8,有Iimgyl(t=e2o4-8”I2但是J彳是N(0,1)分
5、布的特征函数,由于分布函数列F*(x)弱收敛于分布函数F(X)的充要条件是相应的特征函数列n(t)收敛于F(X)的特征函数(t)。所以图一泊松分布示意图4是可以任意选取的,这就意味着三、泊松分布及泊松分布增量1 .泊松分布产生的一般条件在自然界和人们的现实生活中,经常要遇到在随机时刻出现的某种事件,我们把在随机时刻相继出现的事件所形成的序列,叫做随机事件流。假设事件流具有平稳性、无后效性、普通性,那么称该事件流为泊松事件流(泊松流)。例如一放射性源放射出的粒子数;某交换台收到的呼叫数;到某机场降落的飞机数;一个售货员接待的顾客数;一台纺纱机的断头数;等这些事件都可以看作泊松流。2 .泊松分布及
6、泊松分布增量的概率(1)泊松分布的概率:对泊松流,在任意时间间隔(0,t)内,事件出现的次数服从参数为入t的泊松分布,人称为泊松流的强度。设随机变量X所有可能取的值为0,1,2,且概率分布为:P(X=k)=e;,k=0,l,2其中40是常数,那么称X服从参数为的泊松分布,记k作XP()o(2)泊过分布增量的概率:由上式易知增量N(to,t)=N(t)N(to)的概率分布是参数二t-to)的泊松分布,且只与时间f-/0有关。3 .泊松分布的期望和方差:由泊松分布知EN(t)-N(t0)=DN(t)-N(t0)=2(t-t0)特别地,令f0=0,由于假设N(0)=0,故可推知泊松过程的均值函数和方
7、差函数分别为:泊松过程的强度入(常数)等于单位长时间间隔内出现的质点数目的期望值。即对泊松分布有:E(X)=D(X)=4四、泊松分布的特征1 .泊松分布是一种描述和分析稀有事件的概率分布。要观察到这类事件,样本含量n必须很大。2 .%是泊松分布所依赖的唯一参数。值愈小,分布愈偏倚,随着/1的增大,分布趋于对称。3 .当;I=20时分布泊松分布接近于正态分布;当4二50时,可以认为泊松分布呈正态分布。在实际工作中,当X220时就可以用正态分布来近似地处理泊松分布的问题。五、泊松分布与二项分布、正态分布之间的关系1 .二项分布与泊松分布之间的关系定理(泊松定理)在n重伯努利试验中,事件A在每次实验
8、中发生的概率为Pn,它与试验次数有关,!叫刈那么对任意给定的m,有由该定理可知,当二项分布b(n,p)的参数n很大,P很小,而入=np大小适中时,实际中n100,p0.1,np10时,二项分布可用参数为=np的泊松分布来近似,即这就是二项分布的泊松逼近。当然n应尽可能地大,否那么近似效果往往不佳。二项分布的泊松近似常常被应用于研究稀有事件(即每次试验中事件出现的概率P很小),当伯努利试验的次数n很大时,事件发生的频数的分布。实际说明,在一般情况下,当p=re杰定理对任意的ab,有-WH,其中如前文所述,二项分布的泊松近似和正态近似各自适用的条件是不同的。当P很小时,即使n不是很大,用泊松分布近
9、似二项分布,已经相当吻合。但是在这种倩形下,用正态分布去近似二项分布,却会产生较大的误差。直观上也可以想象得到,P很小,n又不大,那么np=人一定不会很大。由上述定理可知,正态分布就不能很好地近似泊松分布,因而也就不能近似被泊松分布十分逼近的二项分布。在n充分大,P既不接近于0也不接近于1时(实际上最好满足0.kp0.9),用正态分布去近似二项分布,效果就较好。表2是用泊松分布与正态分布去近似二项分布b(n,p)的比拟,其中,n=2500,p=0.02,np=50,而=7。可见,在数值上三者是大致相等的。表二泊松分布、正态分布、二项分布的比拟由上述定理易知,泊松分布Kn(入)当ZT8极限分布是
10、正态分布N(,人)。综上所诉,二项分布b(n,p)的参数n很大,P很小,而,二np大小适中时,二项分布可用参数为人二叩的泊松分布来近似;泊松分布泊松分布Xn()当人充分大时的极限分布是正态分布N(入,入),并且泊松分布的分布函数()与正态分布的分布函数N(L入)近似相等。六、泊松分布的应用1 .二项分布的泊松近似常常被应用于研究稀有事件,即每次试验中事件出现的概率P很小,而贝努里试验的次数n很大时,事件发生的概率。例1通过某路口的每辆汽车发生事故的概率为P=0.0001,假设在某路段时间内有1000辆汽车通过此路口,试求在此时间内发生事故次数X的概率分布和发生2次以上事故的概率。分析首先在某时
11、间段内发生事故是属于稀有事件,观察通过路口的IoOo辆汽车发生事故与否,可视为是n二IooO次伯努里试验,出现事故的概率为P=0.0001,因此X是服从二项分布的,即XB(100O,0.0001)。由于n二100O很大,且P=0.0001很小,上面的式子计算工作量很大,那么可以用:I01求近似.注意到np=1000x0.(M)Ol=0.1,故有pX2=l-e-je=O(XM5.2 .泊松分布可以计算大量试验中稀有事件出现频数的概率。这里的频数指在相同条件下,进行大量试验,在这大量试验中,稀有事件发生的次数。例2患色盲者占0.25%,试求:为发现一例色盲者至少要检查25人的概率;为使发现色盲者的
12、概率不小于09,至少要对多少人的辨色力进行检查?分析设X表示恰好发现一例患色盲者所需要检查的人数,那么XG(0.25)o8*-25解px25=p(l-p)=(l-p)24=(0.9975)240.94k=25设至少对n个人的辨色能力进行检查,于是pxn0.9o从而:由I-(I-P)n0.9,W11-lg1-=919.8827.因此至少要检查920人。Ig0.99753 .泊松分布在生物学中的应用:在生物学研究中,服从泊松分布的随机变量是常见的,如每升饮水中大肠杆菌数,计数器小方格中血球数,单位空间中某些野生动物或昆虫数等都是服从泊松分布的。泊松分布在生物学领域中有着广阔的应用前景,对生物学中所
13、涉及到的概率研究起到了重要的指导作用。例3:泊松分布在估计一个基因文库所需克隆数中的应用判断基因克隆过程的分布情况:由于基因组DNA是从大量细胞中提取的,每个细胞中均含有全部基因组DNA,那么每一种限制性片段的数目是大量的,因此可以说各限制性片段的数目是相等的。在基因克隆中,基因组DNA用限制性酶切割后与载体混合反响以及随后的过程均是随机的生化反响过程。一,对克隆来说一限制性片段要么被克隆、要么不被克隆,只有这两种结果;第二,由于总体限制性片段是大量的,被克隆的对总体影响很小;第三,在克隆中一片段被克隆的概率为f(f较小),不被克隆的概率为1-,f且克隆时这两种概率都不变。综上所述,基因克隆过程符合泊松分布。设P为基因被克隆的概率;N为要求的克隆的概率为P时一个基因文库所需含有重组DNA的克隆数;f为限制性片段的平均长度与基因组DNA总长度之比,假设基因组DNA被限制