《卫生统计学钟崇洲5参数估计抽样误差和区间估计.ppt》由会员分享,可在线阅读,更多相关《卫生统计学钟崇洲5参数估计抽样误差和区间估计.ppt(22页珍藏版)》请在第壹文秘上搜索。
1、抽样误差与区间估计抽样误差与区间估计第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误100份样本的均数和标准差 将这100份样本的均数看成新变量值,按第二章的频数分布方法,得到这100个样本均数得直方图见图4-1。图4-1 随机抽样所得100个样本均数的分布 100个样本均数的抽样分布特点:样本均数的抽样分布特点:1.1.100个样本均数中,样本均数中,各样本均数间存在差异各样本均数间存在差异,但但各样本均数在总体均数周围波动。各样本均数在总体均数周围波动。2.2.样本均数的分布曲线为中间高,两边低,样本均数的分布曲线为中间高,两边低,左右对称,近似服从左右对称,近似服从正态分布正态
2、分布。即样本均数的标准差,可用于衡量抽样误即样本均数的标准差,可用于衡量抽样误差的大小。差的大小。因通常未知,计算标准误采用下式:Xn标准误标准误(standard error,SE)XSSn 通过增加样本通过增加样本含量含量n来降低抽来降低抽样误差。样误差。标准误的用途标准误的用途标准误与标准差的区别标准误与标准差的区别1.都是说明离散程度的指标,但标准差描述个体都是说明离散程度的指标,但标准差描述个体间的变异程度,凡同性质资料间的变异程度,凡同性质资料S大表示个体变大表示个体变异大,异大,S小表示个体变异小。小表示个体变异小。2.2.而标准误是样本均数的标准差,描述样本均数而标准误是样本均
3、数的标准差,描述样本均数的抽样误差,即样本均数与总体均数接近程度,的抽样误差,即样本均数与总体均数接近程度,凡同性质资料,凡同性质资料,标准误标准误大,说明用样本均数代大,说明用样本均数代表总体均数可靠性小,表总体均数可靠性小,标准误标准误小,则说明用样小,则说明用样本均数代表总体均数可靠性大。本均数代表总体均数可靠性大。2正态分布正态分布 抽取例数为抽取例数为n的样本的样本样本均数服从正态分布样本均数服从正态分布xxu标准正态分布标准正态分布N(01)即即 u 分分 布布。v在实际工作中在实际工作中 往往不知道,往往不知道,v多用来多用来 估计,这时对正态估计,这时对正态变量采用的不是变量采
4、用的不是u变换而是变换而是t变换变换 xxS:xSxnsxtv不是不是u分布而是分布而是t分布。分布。v(t-distrbution)不同自由度下的t 分布图t分布的特征 以0为中心,左右对称的单峰分布;t分布曲线是一簇曲线,其形态变化与自由度的大小有关。自由度越小,则t 值越分散,曲线越低平;自由度逐渐增大时,t 分布逐渐逼近U分布(标准正态分布);当趋于时,t分布即为U分布。,0.05,10101.812tt,单=0.05,2,0.05/2,10102.228tt,双=0.05,t 界值表界值表1.8122.228-2.228t=10=10的的t t分布图分布图pSX、总体均数的点估计(总
5、体均数的点估计(point estimationpoint estimation)与区间估计)与区间估计(interval estimationinterval estimation)参数的估计参数的估计点估计点估计:由样本统计量:由样本统计量 直接估计直接估计 总体参数总体参数区间估计区间估计:在一定:在一定可信度可信度(Confidence level)下下,同时考虑抽样误差,同时考虑抽样误差、第三节第三节 总体均数的可信区间估计总体均数的可信区间估计 按预先给定的概率按预先给定的概率(1 ),确定一个包含未知总体参数的范确定一个包含未知总体参数的范围。这一范围称为参数的可信区间或置信区间
6、围。这一范围称为参数的可信区间或置信区间(confidence interval,CI)(1 )称为可信度或置信度(称为可信度或置信度(confidence level),常取),常取95。一、置信区间的有关概念一、置信区间的有关概念二、总体均数置信区间的计算二、总体均数置信区间的计算 未知,且未知,且 n 较小,较小,按按t分布分布 已知,或已知,或 未知但未知但n足够大,按足够大,按U分布分布(一)(一)未知,且未知,且 n 较小较小X/2,XXtS/2,XXtS100(1)%面积:1未 知 且未 知 且 n 较 小较 小 的的 总 体 均 数 的总 体 均 数 的 100(1-)%可 信
7、 区 间可 信 区 间 为:为:),()(2/)(2/XXStXStX 或或XStX)(2/例:n=3 0,X=1 7 2.0 1 c m,S=4.2 0 c m,试试 估估 计计 该该 地地2 0 岁岁 男男 大大 学学 生生 身身 高高 总总 体体 均均 数数 的的 9 5 可可 信信 区区 间间。查查 附附 表表2 的的t 界界 值值 表表,得得 双双 侧侧0.05/2,292.045t,即即9 5 可可 信信 区区 间间 为为:)60.173,42.170()2920.4045.201.1722920.4045.201.172(,2未 知 但n 较 大时,按 U 分布计 算 总 体 均 数 的 可 信 区 间。双 侧1可 信 区间 为:xSxx96.1 S96.1xxSuxux SxxSxx58.2 S58.2x3.已知时,总体均数双侧1可信区间为:22=XXZXZn Z0.05/2=1.96Z0.05=1.645四、总体均数可信区间与参考值范围的区别四、总体均数可信区间与参考值范围的区别