《第七章总体均值估计.ppt》由会员分享,可在线阅读,更多相关《第七章总体均值估计.ppt(52页珍藏版)》请在第壹文秘上搜索。
1、第六章抽样调查与总体均值估计主要内容主要内容1、复习点估计、复习点估计2、抽样误差、抽样误差3、区间估计、区间估计正常值范围正常值范围4、统计软件应用、统计软件应用参数估计在统计方法中的地位参数估计参数估计假设检验假设检验 统计方法统计方法描述统计描述统计推断统计推断统计参数估计的方法估估 计计 方方 法法点点 估估 计计区间估计区间估计总体均值估计,总体比例估计总体均值估计,总体比例估计可以估计的总体参数可以估计的总体参数点估计样本值样本值(点估计点估计)平均比例pX1、点估计点估计(:用样本均值数用样本均值数直接作为总体均数的估计值。直接作为总体均数的估计值。点估计是用相应样本平均直接作为
2、其总体平点估计是用相应样本平均直接作为其总体平均的估计值。均的估计值。样本比例估计总体比例样本比例估计总体比例如用如用 估计估计、S估计估计 等。其方法虽简单,等。其方法虽简单,但未考虑抽样误差的大小。但未考虑抽样误差的大小。x抽样误差抽样误差随机误差是由偶然的原因造成的误差。随机误差是由偶然的原因造成的误差。抽样造成的误差不可避免,但可以控制和估抽样造成的误差不可避免,但可以控制和估计。如样本量越大则误差越小。计。如样本量越大则误差越小。用EXCEL实验,从班级成绩中抽出样本计算平均值,与班级平均值的差异就是误差。演示无偏估计的意义 用EXCEL对班级成绩多次抽样,计算每次抽样的平均值。计算
3、多次抽样的样本平均值的再平均。发现离总的全班有平均值差异很小。抽样误差:由于抽样引起的样本统计量与总体参由于抽样引起的样本统计量与总体参数之间的差异。数之间的差异。抽样误差:样本均值估计总体均值时产生的抽样误差:样本均值估计总体均值时产生的误差。误差。Xx 的差的绝对值与总体均值样本均值Xx称为抽样误差称为抽样误差区间估计是按预先给定的概率区间估计是按预先给定的概率(1)所确定的所确定的包含未知总体参数的一个范围。该范围称为包含未知总体参数的一个范围。该范围称为参数的可信区间或置信区间参数的可信区间或置信区间(confidence interval,CI);预先给定的概率预先给定的概率(1)称
4、为可信度或置信度称为可信度或置信度(confidence level),常取,常取95%或或99%。可信区间通常由两个数值即可信限可信区间通常由两个数值即可信限/置信限置信限(confidence limit,CL)构成。其中较小的值构成。其中较小的值称可信下限称可信下限(lower limit,L),较大的值称可,较大的值称可信上限信上限(upper limit,U),一般表示为,一般表示为L U。用区间表示正常值 估计区间 男 女年龄组 体重(千克)身高(厘米)体重(千克)体重(千克)身高(厘米)身高(厘米)3.5岁 13.9-17.6 95.0-103.1 13.5-17.2 94.0-
5、101.8 4.0岁 14.8-18.7 98.7-107.2 14.3-18.3 97.6-105.7 4.5岁 15.7-19.9 102.1-111.0 15.0-19.4 100.9-109.3 5.0岁 16.6-21.1 105.3-114.5 15.7-20.4 104.0-112.8 5.5岁 17.4-22.3 108.4-117.8 16.5-21.6 106.9-116.2 6.0岁 18.4-23.6 111.2-121.0 17.3-22.9 109.7-119.6 7.0岁 20.2-26.5 116.6-126.8 19.1-26.0 115.1-126.2 8.
6、0岁 22.2-30.0 121.6-132.2 21.4-30.2 120.4-132.4 9.0岁 24.3-34.0 126.5-137.8 24.1-35.3 125.7-138.7 10.0岁 26.8-38.7 131.4-143.6 27.2-40.9 131.5-145.1 16岁:体重:年龄x2816公斤 身高:年龄x677101厘米正常范围(正常范围(normal range value)在临床医学上成年人血压的正常值范围是:收缩压90-139mmHg,舒张压60-89mmHg;脉压差正常范围是30-40 mmHg。年龄年龄收缩压收缩压(男)(男)舒张压舒张压(男)(男)收
7、缩压收缩压(女)(女)舒张压舒张压(女)(女)16201157311070212511573110712630115751127331351177611474364012080116774145124811227846501288212879515513484134805660137841398261651488614583中国人平均正常血压参考值中国人平均正常血压参考值(mmHg)年龄年龄收缩压收缩压舒张压舒张压kPammHgkPammHg成人成人12.018.7901408.012.06090新生儿新生儿10.1764.53416月月9.313.3701004.06.03045612月月1
8、214901054.76.0354512岁岁11.314.0851055.06.7405027岁岁11.314.0851057.38.75565712岁岁12.014.7901108.010.06075人的血压正常范围(人的血压正常范围(normal range value)网络搜索 化验的正常值肝功能化验结果正常值如下:肝功能化验结果正常值如下:用区间表示用区间表示ALT(谷丙转氨酶)正常值:男5-40 U/L,女5-35 U/L。AST(谷草转氨酶)正常值:8-40 U/L。AST/ALT(谷草/谷丙)正常值:1.0-2.0。GGT(谷氨酰转移酶)正常值:男 11-50 U/L,女 7-3
9、2 U/L。ALP(碱性磷酸酶)正常值:成人40-150 U/L。TBILI(总胆红素)正常值:3.0-20.0 umol/L。DBILI(直接胆红素)正常值:1.7-8.0 umol/L。PT(凝血酶原时间)正常值:11-14秒。IBILI(间接胆红素)正常值:3.4-13.5 umol/L。PTA(凝血酶原活动度)正常值:80-100。TP(总蛋白)正常值:成人坐立位:64-83 g/L;成人卧位:60-78 g/L。AFP(甲胎蛋白)正常值:50g/L。ALB(白蛋白)正常值:35-52g/L。IgG(免疫球蛋白G)正常值:12.871.35g/L。GLB(球蛋白)正常值:22-38 g
10、/L。IgA(免疫球蛋白A)正常值:2.350.34g/L。ALB/GLB(白球比)正常值:1.3-2.5。IgM(免疫)正常值:1.080.24g/L。GLU(葡萄糖)正常值:3.9-6.1 mmol/L。C3(补体3)正常值:1.140.27g/L。BUN(尿素氮)正常值:2.9-8.2 mmol/L。C4(补体4)正常值:553109mg/L。CHE(胆碱性酯酶)正常值:5000-12000 U/L。CK(肌酸激酶)正常值:24.0195.0。CHOL(总胆固醇)正常值:3.356.45。TRIG(甘油三酯)正常值:0.481.71。CRE(肌酐)正常值:男 62-115 umol/L,
11、女 53-97umol/L。URIC(尿酸):男 208-428 umol/L,女155-357umol/L。LDH-L(乳酸脱氢酶)正常值:109245。T淋巴细胞亚群 CD3正常值:0.56-0.76。T淋巴细胞亚群 CD4正常值:0.38-0.52。T淋巴细胞亚群CD5正常值:0.22-0.32。点估计与区间估计 点估计是一个数值,置信区间提供了更多的变化信息点估计点估计置信下限置信下限置信上限置信上限置信区间宽度置信区间宽度区间估计区间估计(interval estimate)1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到2.根据样本统计量的
12、抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如,某班级平均分数在7585之间,置信水平是95%一般公式 所有估计区间的一般公式点估计点估计 (临界值临界值)(标准误差标准误差)点估计点估计 (2)(标准误差标准误差)意义:意义:虽然不能知道某市全体成人脉搏均数的确切虽然不能知道某市全体成人脉搏均数的确切数值,但有数值,但有95%的把握说该市全体成人脉搏均数的把握说该市全体成人脉搏均数在在73.9次次/分分-75.1次次/分之间分之间,有,有99%的把握说该的把握说该市全体成人脉搏均数在市全体成人脉搏均数在 73.7次次/分分-75.3次次/分之间分之间。换句话说,做出该市成人
13、脉搏均数为换句话说,做出该市成人脉搏均数为73.9次次/分分-75.1次次/分的结论,说对的概率是分的结论,说对的概率是95%,说错的概,说错的概率是率是5%;做出该市成人脉搏均数为做出该市成人脉搏均数为73.7次次/分分-75.3次次/分的分的结论,说对的概率是结论,说对的概率是99%,说错的概率是,说错的概率是1%。区间估计的图示1.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 2.表示为(1-为是总体参数未在未在区间内的比例3.常用的置信水平值有 99%,95%,90%相应的相应的 为0.01,0.05,0.10置信水平(confidence le
14、vel)1.由样本统计量所构造的总体参数的估计区间称为置信区间2.统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 3.用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个总体参数以一定的概率落在这一区间的表述是错误总体参数以一定的概率落在这一区间的表述是错误的的置信区间(confidence interval)置信区间与置信水平 xIntervals and Level of ConfidenceConfide
15、nce Intervals Intervals extend from to (1-)x100%of intervals constructed contain;()x100%do not.Sampling Distribution of the MeannZXnZXxx1x2/2/21总体平均的抽样估计总体平均的抽样估计xXnxxxxxin得到样本均值从总体中抽取样本,.,21用样本均值用样本均值估计总体均值估计总体均值抽样估计误差为抽样估计误差为Xx 1)(212nxxSniiXx 抽样误差抽样误差是无法直接求出得,是无法直接求出得,因为因为xX是未知的,是未知的,xXx换一个思考方法换一
16、个思考方法是已知的是已知的x将求将求Xx 的问题,转换为求的问题,转换为求x称为极限误差(边际误差),抽样误差称为极限误差(边际误差),抽样误差的最大限的最大限,置信区间的半径。置信区间的半径。假若已经求出极限误差假若已经求出极限误差x则则XxXxxxxXxxxXx展开不等式得展开不等式得得到了总体均值得到了总体均值估计区间估计区间总体均值总体均值 =X样本均值样本均值x是是 的无偏估计的无偏估计)(xE设总体的标准差为设总体的标准差为 由中心极限定理得由中心极限定理得x服从正态分布服从正态分布),(2nXNx)1,0(/)(NnXx1)/(nXxP1)/(nXxPnXx/由由得到极限误差得到极限误差由中心极限定理由中心极限定理nXx/用样本标准差用样本标准差s代替代替 查正态分布表得到,可以计算极限误差查正态分布表得到,可以计算极限误差2212)(1)(SEnxxSniinsXx/x用代替用代替 时,严格地讲,统计量时,严格地讲,统计量),(2nsXNnsXxt服从自由度为服从自由度为n-1的分布的分布大样本时用正态分布近似计算,统计用的样本大样本时用正态分布近似计算,统计用的样本一