《生物统计学7.ppt》由会员分享,可在线阅读,更多相关《生物统计学7.ppt(37页珍藏版)》请在第壹文秘上搜索。
1、第七章第七章 拟合优度检验拟合优度检验- 2 2检验检验n第一节第一节 拟合优度拟合优度检验的一般检验的一般原理原理n第二节第二节 拟合优度检验拟合优度检验n第三节第三节 独立性检验独立性检验第一节第一节 拟合优度检验的一般原理拟合优度检验的一般原理n什么是拟合优度检验?什么是拟合优度检验? 拟合优度检验是用来检验实际观测数与依照某种假设拟合优度检验是用来检验实际观测数与依照某种假设或模型计算出来的理论数之间的一致性,以便判断该假设或模型计算出来的理论数之间的一致性,以便判断该假设或模型是否与观测数相配合。或模型是否与观测数相配合。 该检验包括两种类型。第一种类型是检验观测数与理该检验包括两种
2、类型。第一种类型是检验观测数与理论数之间的一致性;第二种类型是通过检验观测数与理论论数之间的一致性;第二种类型是通过检验观测数与理论数之间的一致性来判断事件之间的独立性。数之间的一致性来判断事件之间的独立性。 这两种类型的问题都使用这两种类型的问题都使用 2检验检验拟合优度检验的统计量拟合优度检验的统计量n例:统计某奶牛场一年所生统计某奶牛场一年所生68头犊牛中:母犊头犊牛中:母犊30头、公犊头、公犊38头。按头。按1:1的性别比例,的性别比例,68头犊牛中公、母的理论头数应头犊牛中公、母的理论头数应各为各为34头。头。n问公、母犊之间的差异是抽样误差造成,还是犊牛性别比问公、母犊之间的差异是
3、抽样误差造成,还是犊牛性别比例发生了实质性的变化例发生了实质性的变化? ? p将观测值分为将观测值分为k种不同类别。上例种不同类别。上例 k=2k=2( (公、母公、母) )。p共获得共获得n个独立的观测值,第个独立的观测值,第i类观测值的数目为类观测值的数目为Oi, p第第i类的概率为类的概率为pi 。 p1=1/2, =1/2, p2=1/2=1/2. .p第第i类的理论数为类的理论数为Ti,Ti=npi. .则则T1=T2=34。pOi与与Ti进行比较,判断进行比较,判断Oi与与Ti之间总的不符合程度有否由之间总的不符合程度有否由于机会造成的于机会造成的1kiiOn1383068kiiO
4、1kiiTn11kiip1()kiiiOT21()kiiiOT21()kiiiiOTT2211()()kkiiiiiiiiiOTOTTTT221()kiiiiOTxT恒等于恒等于0 0得不到相对的得不到相对的不符合程度不符合程度不准确不准确此统计量在此统计量在n n充分大时近充分大时近似服从似服从 2分布,要求每一分布,要求每一组内的理论数不得小于组内的理论数不得小于5 5。实际观察次数Oi理论次数TiOi - Ti( Oi - Ti )2/ Ti38(O1)34(T1)40.470630(O2)34(T2)-40.4706686800.9412表表 犊牛性别实际观察次数与理论次数犊牛性别实际
5、观察次数与理论次数返回本节返回本节2211(| 0.5) ()kiiiiOTxT自由度为 时的矫正式n 2是度量实际观察次数与理论次数偏离程度的一个统计量。是度量实际观察次数与理论次数偏离程度的一个统计量。 2 2 的大小说明了什么?的大小说明了什么? n 2的自由度为的自由度为 df=k-1-n为需要由样本估计的参数的个数。为需要由样本估计的参数的个数。 k指资料的属性类指资料的属性类别数别数( (性状、性别、表现型等性状、性别、表现型等) )。n当当dfdf=1 =1 时应做连续性矫正。时应做连续性矫正。返回本章返回本章第二节第二节 拟合优度检验拟合优度检验n1、一般程序n2、对二项分布的
6、检验n3、对正态性的检验已知已知未知未知返回本章返回本章1、一般程序、一般程序1)按第一章第二节所介绍方法对数据进行分组按第一章第二节所介绍方法对数据进行分组(对于离散型对于离散型数据,组间距通常是数据,组间距通常是1)。2)根据总体分布类型和样本含量根据总体分布类型和样本含量n计算理论数计算理论数Ti。3)有时需用样本数据估计总体参数。计所估计参数的个数有时需用样本数据估计总体参数。计所估计参数的个数为为a。4)合并两个尾区的理论数使之不小于合并两个尾区的理论数使之不小于5,合并后的组数记,合并后的组数记为为k。5)相应于相应于2的自由度为的自由度为k-1,相应于,相应于3的自由度为的自由度
7、为k-1-a. 6) 零假设:因为拟合优度零假设:因为拟合优度2检验不是针对总体参数做检检验不是针对总体参数做检验的,因而零假设不需提出具体参数值,只需判断观测数验的,因而零假设不需提出具体参数值,只需判断观测数是否符合理论数或某一理论分布。它的零假设是观测数与是否符合理论数或某一理论分布。它的零假设是观测数与理论数相符合,可形象化地记为理论数相符合,可形象化地记为H0:O-T0。 7)计算出计算出2值并与值并与2临界值比较,当临界值比较,当2 2时拒绝时拒绝H0;当当2 2 时接受时接受H0返回本节返回本节1、一般程序、一般程序n例 纯合的黄圆豌豆与绿皱豌豆杂交,纯合的黄圆豌豆与绿皱豌豆杂交
8、,F F1 1自交,第二代分自交,第二代分离数目如下,问是否符合自由组合规律?离数目如下,问是否符合自由组合规律?Y_R_Y_rryyR_yyrr总计(黄圆)(黄皱)(绿圆)(绿皱)31510110832556n当性状间相互独立时,根据独立分配律,当性状间相互独立时,根据独立分配律,F2代的表现型可可由二项分布给出,记显性性状出现的概率为由二项分布给出,记显性性状出现的概率为 , =3/4。n因一种表现型由一对等位基因决定,本例为两对等位基因因一种表现型由一对等位基因决定,本例为两对等位基因的自由组合,故的自由组合,故n=2。2、对二项分布的检验、对二项分布的检验- 已知已知2319331(+
9、) =+44161616169331Y_R_Y_R_:yyrr = :16 16 16 16:rr:yy理论分离比为:理论分离比为:列下表列下表2、对二项分布的检验、对二项分布的检验- p 已知已知n理论数理论数T Ti i均大于均大于5 5,不需合并,不需合并n Ho:OT0, =0.05n因计算理论数时参数因计算理论数时参数是是已知的,则已知的,则a=0,自由度,自由度df=4-1=3.n结论是接受结论是接受H Ho o,符合,符合9 9:3 3:3 3:1 1的分离比。的分离比。 dfdf=3=3不需矫不需矫正。正。2223,0.050.057.815,0.05xxxP返回本节返回本节2
10、、对二项分布的检验、对二项分布的检验- p 已知已知n例 用用800粒牧草种子进行发芽试验,分粒牧草种子进行发芽试验,分80行,每行行,每行10粒粒种子,共有种子,共有174粒发芽。则每粒种子发芽的概率约为粒发芽。则每粒种子发芽的概率约为174/800=0.2175,不发芽的概率约为,不发芽的概率约为0.7825(即(即1-0.2175),每行发芽种子数见下表,),每行发芽种子数见下表,n问该资料是否服从二项分布。问该资料是否服从二项分布。 对二项分布的检验对二项分布的检验- 未知未知62028126.888019.136023.936017.744062028126.888019.13602
11、3.936017.7440表表 8080行发芽试验资料服从二项分布的适合性检验计算表行发芽试验资料服从二项分布的适合性检验计算表一行内种子一行内种子发芽数发芽数实际行数实际行数O理论概率理论概率理论行数理论行数T0123456789106202812860 0 14 0000.08610.23920.29920.22180.10790.03600.00830.00130.00010.00000.00006.888019.136023.936017.74408.63202.88000.66400.1040 12.36000.08000.00000.00000.11450.03900.69001.
12、85940.2176总总 和和802.9205对二项分布的检验对二项分布的检验- 未知未知n表中理论概率由二项分布概率计算公式:计算,如表中理论概率由二项分布概率计算公式:计算,如n表中的理论行数由理论概率乘以表中的理论行数由理论概率乘以80行而得,如行而得,如q0.0861 80=6.8880,q0.2392 80=19.1360n由于表中后由于表中后6组的理论次数均小于组的理论次数均小于5,故将后,故将后6组与第组与第5组组合并为一组。并组以后,资料分为合并为一组。并组以后,资料分为5组。组。00100101010!0.21750.78250.086110!0!C p q119191010
13、!0.21750.78250.23929!1!C p q 对二项分布的检验对二项分布的检验- p 未知未知n由表可知,由表可知, 2=2.9025。由。由df=5-2=3,查,查 2值表得:值表得: 20.05(3)=7.81,因为,因为 20.05,n表明实际行数与由二项分布计算得来的理论行数差异不显表明实际行数与由二项分布计算得来的理论行数差异不显著,可以认为种子发芽试验的结果服从二项分布。著,可以认为种子发芽试验的结果服从二项分布。返回本节返回本节对二项分布的检验对二项分布的检验- p 未知未知3、对正态性的检验、对正态性的检验3、对正态性的检验、对正态性的检验第三节第三节 独立性检验独
14、立性检验( (independence test) )n列联表(contingency table) 2 2检验检验是另一种类型的是另一种类型的 2 2检检验,可以用它检验事件间的独立性或者说检验处理之间的验,可以用它检验事件间的独立性或者说检验处理之间的差异显著性。差异显著性。 n下表是不同给药方式与给药效果表。问口服给药与注射给下表是不同给药方式与给药效果表。问口服给药与注射给药的效果有无差异?药的效果有无差异?没有理论没有理论数据?数据?n上表为上表为2 22 2列联表,其列联表,其 2 2检验一般经经以下各步:检验一般经经以下各步:n1 1)提出零假设)提出零假设:H H0 0:O O
15、T T0 0。实际观测的结果与理论数之。实际观测的结果与理论数之间无差异。即认为有效或无效与给药方式无关联。间无差异。即认为有效或无效与给药方式无关联。2 2)求理论值:)求理论值:根据事件的概率法则,若事件根据事件的概率法则,若事件A A和事件和事件B B是相互独立的,则有是相互独立的,则有在零假设的基础上,有:在零假设的基础上,有:其理论数其理论数T1可由理论频数乘以总数得出:同样可求出可由理论频数乘以总数得出:同样可求出其它理论数。其它理论数。()( ) ( )P ABP A P B98122()( ) ( )()()193 193P BAP B P A198122(98)(122)()
16、()(193)(193)61.5193 193193T p3 3)如吻合度一样计算)如吻合度一样计算 2 2值值,若,若 2 2 2 2,说明什么?若,说明什么?若 2 2 2 2说明什么?说明什么?p4 4)确定自由度)确定自由度。 2 22 2列联表自由度是(列联表自由度是(r-1)(c-1r-1)(c-1)p5)5)推论与绪论:推论与绪论:接受接受Ho,即,即用口服方式给药与注射方式用口服方式给药与注射方式绐药的效果没有显著不同;绐药的效果没有显著不同;l 注:因为已经接受注:因为已经接受H Ho o,不必再矫正,不必再矫正返回本节返回本节6 6、r rc c列联表列联表行数和列数都大于2的列联表称为rc列联表(rc contingency table )其理论数的计算为:其自由度为:()()ijijT 行总数列总数总数(1)(1)dfrc.ijTTT为所在行总数;为所在列总数;为总数。n例:例:在甲、乙两地进行水牛体型调查,将体型按优、良、中、在甲、乙两地进行水牛体型调查,将体型按优、良、中、劣劣 四个等级分类,其结果见下表,问两地水牛体型构成比四个等级分类,其结果见下表,问两