《第6章二项分布与Poisson分布.ppt》由会员分享,可在线阅读,更多相关《第6章二项分布与Poisson分布.ppt(33页珍藏版)》请在第壹文秘上搜索。
1、二项分布二项分布 与与PoissonPoisson分布分布离散型随机变量概率分布:二项分布、累积二项分布、超几何分布、负二项分布和泊松分布。最常用的概率分布,即二项分布项分布和泊泊松分布松分布二项分布与二项分布与PoissonPoisson分布及其分布及其应用应用 三种重要分布:正态分布三种重要分布:正态分布 二项分布二项分布 Poisson分布分布二 项 分 布 定义:在n次独立实验中,每次有两个对立的结果(如阳性或阴性,生存或死亡),其中某种阳性或阴性发生数X所服从的概率分布称为二项分布(binomial distrbution)。成成败型试验败型试验:成功次数的概率分布呈二项分布.故,构
2、成Bernoulli Test序列中的n次试验中,事件A出现的次数的概率分布为:P(X=k)=(kn)k(1-)n-k其中k=0,1,n。上式是二项式+(1-)n 展开式的各项,所以此分布为二项分布。n、是二个参数。是二个参数。若一个随机变量若一个随机变量X,X,其取值是其取值是0 0,1 1,n n。则相应取值概率为:则相应取值概率为:P(X=k)=(kn)k(1-)n-k 所以,X X服从以服从以n、为参数的为参数的二项分布。记为:X XB(B(n、).).二项分布的均数与方差二项分布的均数与方差若若X XB(B(n n、),则则 X X的均数的均数 x x=n n X X的方差的方差 2
3、 2x x=n n(1-)(1-)X X的标准差的标准差 x x=n n(1-)(1-)例:已知例:已知=0.6 3=0.6 3只鼠中死亡鼠数只鼠中死亡鼠数X X的的 总体均数总体均数 x x=n n=3=3 0.6=1.8(0.6=1.8(只只)总体方差总体方差 2 2x x=n n(1-)=(1-)=3 3 0.6(1-0.6)=0.72(0.6(1-0.6)=0.72(只只)总体标准差总体标准差 x x=n n(1-)(1-)=3 3 0.6(1-0.6)0.6(1-0.6)=0.72=0.85(0.72=0.85(只只)条件:条件:(1)(1)总体中各观察单位具有互相对立的一总体中各观
4、察单位具有互相对立的一种结果种结果(“成功成功”或或“失败失败”)(2)(2)已知发生某一结果的概率为已知发生某一结果的概率为,则对,则对立结果的概率为立结果的概率为1-1-。出现出现“成功成功”的的概率概率p对每一次试验是相同的,对每一次试验是相同的,“失败失败”的概率的概率q也不变,且也不变,且p+ql。(3)(3)n个观察单位的观察结果相互独立,个观察单位的观察结果相互独立,即每个观察单位结果不会影响其他观察即每个观察单位结果不会影响其他观察单位的结果单位的结果 例例题题 例:用淋菌培养方法,检查患者是否患有淋病。对于淋病患者,若用该方法检查一次的检出率为0.8,问:1)重复检查3次,检
5、查结果均为阴性的概率是多少?P=(1-0.8)3=0.008 2)重复检查3次,检查结果中最少是阳性的概率是多少?P=1-(1-0.8)3=0.992 3)检查4个患者,每人检查一次,第一个患者和第二个患者为阳性且其他均为阴性的概率是多少?P=0.820.22=0.02565)检查 4 个患者,每人检查一次,其中二个患者为阳性且其他均为阴性的概率是多少?第一个患者 第二个患者 第三个患者 第四个患者 发生的概率 阳性 阳性 阴性 阴性 P=0.820.22=0.0256 阳性 阴性 阳性 阴性 P=0.820.22=0.0256 阳性 阴性 阴性 阳性 P=0.820.22=0.0256 阴性
6、 阳性 阳性 阴性 P=0.820.22=0.0256 阴性 阳性 阴性 阳性 P=0.820.22=0.0256 阴性 阴性 阳性 阳性 P=0.820.22=0.0256 因此 4 个患者中 2 个患者检查出阳性的概率为上述概率之和 P60.820.2222242.08.0C 如果研究背景满足下列条件如果研究背景满足下列条件:1)1)每次试验的可能结果每次试验的可能结果(Outcome)(Outcome)仅为两种仅为两种(视为成功或失视为成功或失败,在上例中阳性或阴性败,在上例中阳性或阴性)。2)2)定义试验中其中一个可能的结果成功,另一种可能的结定义试验中其中一个可能的结果成功,另一种可
7、能的结果为失败果为失败(在上例中把检查结果为阳性可视为成功,检查在上例中把检查结果为阳性可视为成功,检查结果为阴性为失败结果为阴性为失败)。3)3)每次试验的条件相同。每次试验成功的概率为每次试验的条件相同。每次试验成功的概率为,失败,失败的概率为的概率为1-(1-(在上例中把检出阳性的概率在上例中把检出阳性的概率为为0.80.8,检,检查阴性的概率查阴性的概率1-1-为为=0.2)=0.2)4)4)试验次数为试验次数为n(n(上例中上例中n=4)n=4)。则在n次试验中,有X次成功的概率(在上例中,4个患者检查,即:n=4;有x个患者为阳性的)为:XnXXnXxn)1()!xn(!x!n)1
8、(C)x(P n,2,1,0 x并记为XB(n,)00.050.10.150.20.250.3012345678910X概率二项分布图形 平均发生率P的均数和标准差:平均发生率对应的总体均数为 标准误为 对应的样本标准误为 pn)1(p n)p1(pSp 例:某医院治疗了50个HP的患者,35个患者转阴,请计算样本转阴率和样本标准误(把治疗一个HP患者视为一次试验,治疗50个患者,视为50次试验,把患者通过治疗后转阴的结果视为试验成功)。转阴率 转阴率的标准误 7.05035P0648.050)7.01(7.0Sp二项分布的应用一、总体率可信区间估计一、总体率可信区间估计:1 1、大样本时、大
9、样本时,二项分布的总体发生率的95%可信区间(设X服从二项分布B(n,),n 5以及以及n(1-)5,当n充分大时)则的95可信区间(95%CI)为 p1.96SP 例:调查了1000名男性,检查出10名男性是色盲的,试求色盲患病率的95可信区间。色盲样本患病率 ,n=1000。因此nP与n(1-P)均大于5以及n也充分大 所以95CI为:(0.01-1.960.003146,0.01+1.960.003146)=(0.003834,0.016166)01.0100010P003146.01000)01.01(01.0PSp1.96SP 2 2、样本量较小时,、样本量较小时,计算比较复杂,因此
10、建议查本书计算比较复杂,因此建议查本书附表附表 6(P709)(P709)例:治疗25个HP患者,12个患者转阴,求转阴率的95可信区间:解:n=25,X12,查附表查附表6,95%CI=(0.28,0.69)例:某医院抢救20个AMI患者,14个抢救成功,求抢救成功率的95%CI。解:由于X仅列出n/2的可信区间,不能直接查表求95CI。本例n=20,6个抢救未成功,故可查未成功故可查未成功率率1-的的95%CI为:为:0.121-1-0.54,所以0.88=1-0.121-0.54=0.46,即:95CI为为(0.46,0.88)。二、二、分类资料的假设检验分类资料的假设检验 1、样本率与
11、总体率的比较样本率与总体率的比较 总体率(0)一般为标准值(或经过大量观察所得到的稳定值),比较目的 是推断实验所得某个样本率所代表的总体率是否是来自0总体的一个样本。(即检验假设为H0:=0是否成立)1 1)X X服从二项分布,总体发生率为服从二项分布,总体发生率为,并且,并且 且且 ,且,且n40n40,则,则 5n5)1(n(1)(1)XPnunnnXP 例:用传统的治疗方案治疗例:用传统的治疗方案治疗HPHP患者的治愈率为患者的治愈率为0.80.8。某研。某研究用一种新的治疗方案治疗了究用一种新的治疗方案治疗了100100个个HPHP患者,治愈了患者,治愈了9090个,个,问:用新的治
12、疗方案的治愈率是否高于传统的治疗方案?问:用新的治疗方案的治愈率是否高于传统的治疗方案?H H0 0:新的治疗方案的总体治愈率:新的治疗方案的总体治愈率=0.8=0.8;H H1 1:0.8 0.8 =0.05=0.05 (单侧)(单侧)且 且n=10040,故可用正态分布进行近似。U U0.05=1.64,=1.64,差别有统计意义差别有统计意义,P0.05 结论:新的治疗方案的治愈率高于传统治疗方案的治愈率,结论:新的治疗方案的治愈率高于传统治疗方案的治愈率,差别有统计意义,差别有统计意义,P50时,可以用近似正态的方法计算可信区间:XuXXuX Poisson分布的样本均数与总体均数的比
13、较分布的样本均数与总体均数的比较 1 1、直接计算、直接计算P值值 已知在培养液中,每毫升平均有3个细菌数,今采集放在5。C冰箱中的1毫升培养液测得细菌数5个,能否说培养液中细菌数有增长?H0:3/ml vs H1:3/ml 样本值X5,对应的概率 533(5|3)0.100815!P XeP(X5)值=1-P(4)-P(3)-P(2)-P(1)-P(0)=1-0.1494-0.2240-0.2240-0.1680-0.0498 =0.18470.050.18470.05 2、正态近似法:正态近似法:当当 0 0 2020时,时,H H0 0成立时,成立时,服从标准服从标准正态分布正态分布 例
14、:已知人群的肝癌的患病率为例:已知人群的肝癌的患病率为0.03%0.03%,调查了,调查了1010万个饮用灌溉沟水的人,共有万个饮用灌溉沟水的人,共有5050人患肝癌,问:饮人患肝癌,问:饮用灌溉沟水的人的肝癌患病率是否高于用灌溉沟水的人的肝癌患病率是否高于0.03%0.03%?0 0=n=n 0 0=100000=1000000.0003=3020 0.0003=3020 H H0 0:=30 vs=30 vs H H1 1:30 30=0.05=0.05(单)(单)00Xu652.3303050u1.65,故可以认为:饮用,故可以认为:饮用灌溉沟水的人肝癌患病率灌溉沟水的人肝癌患病率高于一般。高于一般。Poisson分布的两个样本均数比较的分布的两个样本均数比较的U检验检验 若两个样本均数X1和X2均大于20 观察单位相等的情况下:观察动物不相等的情况下,用除法将化大单位为小单位 2121XXXXu221121n/Xn/XXXu 例:调查100000个饮用灌溉沟水的人,患肝癌50人,调查150000个饮用河水的人,患肝癌65人,问饮用河水与饮用灌溉沟水的人的肝癌患病率是否不同。因为单位不同,故选用5000人为单位,因此n1=2,n2=3,即:样本均数均大于20,可以正态近似进行检验:252/50X167.213/65X27498.03/67.212/2567.2125u