《石大医学统计学讲义05总体均数的估计和假设检验.docx》由会员分享,可在线阅读,更多相关《石大医学统计学讲义05总体均数的估计和假设检验.docx(3页珍藏版)》请在第壹文秘上搜索。
1、第五讲总体均数的估计和假设检验医学统计学的最基本问题是研究总体与样本的关系。总体与样本的关系,可从两方面研究:(I)由已知的总体,研究样本的分布规律,即由总体到样本的研究过程;(2)由样本如何去推断未知的总体,属于从样本到总体的研究过程。1、从一个正态总体中抽取的样本统计量分布生物学中遇到最多的是正态总体。对于正态总体,可以用数学推演的方法,得出严格的样本统计量的抽样分布,有了严格的样本分布规律,就可以由样本来推断总体了。标准差已知时的样本平均数的分布一一u分布平均数为,标准差为o的正态总体中,独立随机的抽取含量为n的样本,则:%=N外=不样本平均数是一服从正态分布的随机变量,记为X。将平均数
2、标准化,贝hx-u=忑其中的分母称为平均数的标准误差(StarldardeiTOrOfrnear1)。如果变量是正态的或近似正态的,则标准化的变量服从或近似地服从N(0,1)分布。1标准差已知时的样本平均数的分布1分布(t-distrihution)若上式中的o是未知的,可用样本标准差代替总体标准差,标准化变量并不服从正态分布,而服从具有n-1自由度的t分布。白忑,分布也是一种对称分布,它只有一个参数,即自由度(degreeoffreedom)t分布与标准正态分布相比有以下特征:(1)二者都是单峰分布,以0为中心,左右两侧对称。(2)t分布的峰部较矮而尾部翘得较高,说明远但卜值的个数相对较多,
3、即尾部面积(概率P)较大。自由度越小这种情况越明显。V逐渐增大时,t分布逐渐逼近标准正态分布;当v=时,t分布就完全成为标准正态分布了。2、统计推断统计推断是讨论如何通过样本去推断总体。由样本推断总体是以各种样本统计量的抽样分布为基础的。对总体做统计推断(Statiinference),可以通过两条途径进行。-是通过样本统计量估计总体参数;二是首先对所估计的总体提出一个假设,例如假设这个总体的平均数等于某个值0,然后,通过样本数据去推断这个假设是否可以接受,如果可以接受,样本很可能抽自这个总体;否则很可能不是抽自这个总体。前i种途径称为总体参数估计(estimationofpopulation
4、parameter),后一种途径称为统计假设检验(statisticaltestofhypothesis)。这两种不同的统计分析方法在实际工作中可互相参照使用。3、总体均数的估计区间估计(internalestimation)即按一定的概率估计总体均数在哪个范围。可根据资料的条件选用不同的方法。(1) 未知时。一般用t分布的原理作区间估计。根据于是得可信度为l-时,计算总体均数可信区间的通式为:P-tavttav)=-a(l-a为可信度)得PTaj,*,)=1-。XTw(刀=)/X+t习惯上,常取l-=0.95,即95%可信区间;或取l-=0.99,即99%可信区间。例题1、对某人群随机抽取2
5、0人,用某批号的结核菌素作皮试,平均侵润直径为10.9mm,标准差为3.86mm。问这批结核菌素在该人群中使用时,皮试的平均侵润直径的95%可信区间是多少?本例,n=20,v=n-1=20-1=19,=0.05(双版IJ)查附表,得Sg19=2.093(10.9-2.093X堇,10.9+2.093X型)=(9.1,12.7)所以,该人群皮试的平均侵润直径的95%可信区间为9.112.7mm。(2) 已知或样本例数n足够大时,按正态分布原理作区间估计。区-UaXX+Ua -)b未知伍大(X-UaXX+ Ua -)例题2由某地成年男子中抽得144人的样本,求得红细胞数的均数为5.3810,2/L
6、,标准差为0.44x10因L)试估计该地成年男子红细胞均数的95%可信区间。本例n=144,X=5.38,S=0.44,a=0.05,由于n较大可取u。%=1.96该地成年男子红细胞均数的95%可信区间为(5.31,5.45)o可信区间的涵义意思是从总体中作随机抽样,每个样本可以算出一个可信区间,如95%可信区间,意味着IOO次抽样,算得100个可信区间,平均有95个可信区间包括总体均数(估计正确),只有5个可信区间不包括总体均数(估计错误)。5%是小概率事件,实际发生的可能性小,因此,在实际应用中就认为总体均数在算得的可信区间内,这种估计方法会冒5%犯错的风险。可信区间的两个要素一是准确度,
7、反映在可信度l-的大小,即区间包含总体均数的概率的大小,当然愈接近1愈好;二是精度,反映在区间的长度,当然长度愈小愈好。在样本例数确定的情况下,二者是矛盾的。一般情况下,在可信度确定的情况下,增加样本例数,可减少区间长度,提高精度。假设检验的基本步骤:1. 建立检验假设,确定检验水准H0:无效假设(假定所检验的两个总体均数相等)日:备择假设(假定所检验的两个总体均数不相等)单侧检验:推断两总体均数有无差别双侧检验:根据专业知识推断两总体均数中是否可以认为一个大于(高于)另一个2. 选择检验方法,计算统计量根据分析目的、设计类型和资料类型,选择恰当的检验方法,计算相应的统计量(如:t、u、r、f、2等)。3. 确定P值,作出统计结论用计算出的统计量,根据不同自由度查相应的界值表,确定P值。P值的定义:在Ho所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有样本统计量的概率。结论:当计算的统计量界值表上所查到的理论值,则Po此时,表示在HO成立的条件下,出现等于及大于现有样本统计量的概率是小概率,按其原理,现有信息不支持Ho,因而拒绝Ho。当计算的统计量界值表上所查到的理论值,则Po此时,表示在HO成立的条件下,出现等于及大于现有样本统计量的概率不是小概率,现有信息还不足以拒绝Ho,因此不拒绝Ho。