《统计学基础厦门大学06假设检验.ppt》由会员分享,可在线阅读,更多相关《统计学基础厦门大学06假设检验.ppt(44页珍藏版)》请在第壹文秘上搜索。
1、统计学统计学第六章第六章 假设检验假设检验 假设检验基本原理假设检验基本原理 总体参数检验总体参数检验 非参数检验非参数检验第一节第一节 假设检验基本原理假设检验基本原理 基本原理与程序基本原理与程序 两种类型的错误两种类型的错误 检验功效检验功效 基本原理与程序基本原理与程序 假设检验是以小概率为标准,对总体的状况所假设检验是以小概率为标准,对总体的状况所做出的假设进行判断做出的假设进行判断 假设检验与区间估计结合起来,构成完整的统计推假设检验与区间估计结合起来,构成完整的统计推断内容断内容 假设检验分为两类:假设检验分为两类:参数假设检验参数假设检验 非参数假设检验非参数假设检验 具体地:
2、假设检验首先对总体的分布函数具体地:假设检验首先对总体的分布函数形式或分布的某些参数做出假设,再根据形式或分布的某些参数做出假设,再根据所得样本数据,利用所得样本数据,利用“小概率原理小概率原理”,对,对假设的正确性做出判断的统计推断过程与假设的正确性做出判断的统计推断过程与方法。方法。类似于数学的类似于数学的“反证法反证法”小概率原理:即指概率很小的事件,在一次试小概率原理:即指概率很小的事件,在一次试验中实际上不可能出现。验中实际上不可能出现。一般以某个显著性水平做为小概率的界限,故统计一般以某个显著性水平做为小概率的界限,故统计检验也称为显著性检验。检验也称为显著性检验。原假设与备择假设
3、原假设与备择假设 单侧检验与双侧检验单侧检验与双侧检验 假设检验的基本程序假设检验的基本程序 根据实际问题的需要,提出合适的原假设根据实际问题的需要,提出合适的原假设H0和和备择假设备择假设H1;构造适当的(检验)统计量,并在构造适当的(检验)统计量,并在H0为真的假为真的假定条件下,确定该统计量的抽样分布;定条件下,确定该统计量的抽样分布;根据实际问题的要求给定检验的显著水平根据实际问题的要求给定检验的显著水平,利用检验统计量的抽样分布和显著性水平利用检验统计量的抽样分布和显著性水平,求出相应的临界值,从而划分出拒绝域和接受求出相应的临界值,从而划分出拒绝域和接受域;域;由样本观测值计算检验
4、统计量的观测值,以查由样本观测值计算检验统计量的观测值,以查看样本(或检验统计量)的观测值是属于拒绝看样本(或检验统计量)的观测值是属于拒绝域还是授受域,从而对假设做出拒绝或接受的域还是授受域,从而对假设做出拒绝或接受的决策。决策。两种类型的错误两种类型的错误H0真实真实H0不真实不真实接受接受H0判断正确判断正确取伪错误取伪错误()拒绝拒绝H0拒真错误拒真错误()判断正确判断正确图图5-1:与与 关系示意图关系示意图 1 z 0 检验功效检验功效 一个有效的检验首先是犯第一类错误的概率不一个有效的检验首先是犯第一类错误的概率不能太大能太大 在犯第一类错误的概率得到控制的条件下,犯在犯第一类错
5、误的概率得到控制的条件下,犯取伪错误的概率也要尽可能地小。取伪错误的概率也要尽可能地小。1-beta反映了统计检验判别能力大小的重要标反映了统计检验判别能力大小的重要标志,我们称之为检验功效或检验力。志,我们称之为检验功效或检验力。影响检验功效的三个因素:影响检验功效的三个因素:;样本容量;样本容量;原假设与备选假设间的差异程度。原假设与备选假设间的差异程度。第二节第二节 总体参数检验总体参数检验 单侧检验与双侧检验单侧检验与双侧检验 双侧、单侧检验的拒绝域分配双侧、单侧检验的拒绝域分配 结论:结论:用单侧检验还是双侧检验,用左侧检验还是右侧检用单侧检验还是双侧检验,用左侧检验还是右侧检验,决
6、定于备择假设中的不等式与方向验,决定于备择假设中的不等式与方向 与与“不相等不相等”对应的是双侧检验;对应的是双侧检验;与与“小于号小于号”相对应的是左侧检验;相对应的是左侧检验;与与“大于号大于号”相对应的是右侧检验。相对应的是右侧检验。不等号的箭头正好指示了拒绝区域的位置。不等号的箭头正好指示了拒绝区域的位置。总体平均数的检验总体平均数的检验 总体方差总体方差 2已知的情形已知的情形z检验,其步骤如检验,其步骤如下:下:作出假设;作出假设;构造检验统计量;构造检验统计量;根据显著性水平,确定拒绝域根据显著性水平,确定拒绝域 计算样本统计的数值;计算样本统计的数值;判断判断 总体方差总体方差
7、 2未知的情形未知的情形t检验检验 例例6-3双侧检验(双侧检验(P164)例例6-4单侧检验(单侧检验(P165)例例6-5单侧检验(单侧检验(P165)总体平均数的检验总体平均数的检验 总体方差总体方差 2未未知的情形知的情形t检验,其步骤如下:检验,其步骤如下:作出假设;作出假设;构造检验统计量;构造检验统计量;根据显著性水平,确定拒绝域根据显著性水平,确定拒绝域 计算样本统计的数值;计算样本统计的数值;判断判断 例例6-6双侧检验(双侧检验(P166)例例6-7单侧检验(单侧检验(P167)总体成数的检验总体成数的检验 样本成数是一类特殊的平均数,当样本容量较样本成数是一类特殊的平均数
8、,当样本容量较大时,下列统计量服从标准正态分布:大时,下列统计量服从标准正态分布:1pPzPPn 例例6-8(P168)正态总体方差的假设检验正态总体方差的假设检验 已知样本方差已知样本方差 是总体方是总体方差差 2的无偏估计量,且:的无偏估计量,且:222211nSn221XXSn 对于假设:对于假设:H0:2=02,H1:202,其拒绝,其拒绝域为:域为:其中,其中,k1,k2为临界值,具体为:为临界值,具体为:221201nSk222201nSk或或22121221,1knkn 故拒绝域为:故拒绝域为:上述检验法称为上述检验法称为 2检验法(以上为双边情检验法(以上为双边情形,单边类推)
9、。形,单边类推)。22210211nSn2220211nSn或或 正态总体方差的假设检验正态总体方差的假设检验 其步骤如下:其步骤如下:作出假设;作出假设;构造检验统计量;构造检验统计量;根据显著性水平,确定拒绝域根据显著性水平,确定拒绝域 计算样本统计的数值;计算样本统计的数值;判断判断 例:已知生产某型号的螺钉厂,在正常条例:已知生产某型号的螺钉厂,在正常条件下,其螺钉长度服从正态分布件下,其螺钉长度服从正态分布N(4.0,0.04)。现在我们对某日生产的螺钉随机抽。现在我们对某日生产的螺钉随机抽取取6个,测得其长度为个,测得其长度为4.1,3.6,3.8,4.2,4.1,3.9。对于给定
10、的显著性水平为。对于给定的显著性水平为0.05,试问该日生产的螺钉总体方差是否正常,试问该日生产的螺钉总体方差是否正常?解:解:1.建立假设:建立假设:H0:2 0.04,H1:20.04 2.确定检验统计量:确定检验统计量:3.确定临界值:确定临界值:4.计算样本统计量:计算样本统计量:5.判断:由于判断:由于5.10811.07,故我们没有充分,故我们没有充分理由拒绝原假设,即认为该日生产的螺钉总体理由拒绝原假设,即认为该日生产的螺钉总体方差正常。方差正常。222215nS 20.05511.0722610.2265.1080.04 p-值检验值检验 所谓所谓p-值检验就是拒绝原假设所需的
11、最低显著值检验就是拒绝原假设所需的最低显著性水平性水平 p-值的判断原则是:如果值的判断原则是:如果p值小于给定的显著值小于给定的显著性水平,则拒绝原假设;否则,接受原假设。性水平,则拒绝原假设;否则,接受原假设。或:如果或:如果p值很小,拒绝值很小,拒绝H0,否则接受,否则接受H0。p-值实际上是检验统计量超过(大于或小于)值实际上是检验统计量超过(大于或小于)由样本数据所得数值的概率。由样本数据所得数值的概率。z检验的检验的p-值;值;步骤:步骤:作出假设;作出假设;构造检验统计量;构造检验统计量;计算样本统计的数值;计算样本统计的数值;计算计算p-值;值;判断判断 t检验的检验的p-值值
12、从而,当H0成立时,220,1XYXYzNnm对给定的检验水平 得H0的拒绝域:,222XYXYznmz 双侧检验两个正态总体的均值检验两个正态总体的均值检验 z检验法检验法 22,XY 已知 ,检验H0:XY1.方差已知,检验均值相等 问题:2,XXXN2,YYYN两个正态总体参数的均值检验两个正态总体参数的均值检验 2.方差未知,但两个总体的方差相等,检验均值相等 问题:2,XXXN2,YYYN212,.nY YY112,.nXXX设 是X的一个样本,是Y的一个样本,未知 ,但知 ,检验H0:22,XYXY22XY22()211112XYXYXYTt nmSnSmnmnm第三节第三节 非参
13、数检验非参数检验 自由分布检验概述自由分布检验概述 符号检验符号检验 秩和检验秩和检验 游程检验游程检验 自由分布检验概述自由分布检验概述 自由分布检验与参数检验,其优点是:自由分布检验与参数检验,其优点是:检验条件比较宽松,适应性强;检验条件比较宽松,适应性强;自由分布检验的方法比较灵活,用途广泛;自由分布检验的方法比较灵活,用途广泛;计算相对简单计算相对简单 缺点:缺点:对原始数据中包含的信息利用不够充分,检验的功对原始数据中包含的信息利用不够充分,检验的功效相对较弱效相对较弱 符号检验符号检验只考虑样本间差数的符号只考虑样本间差数的符号 单样本场合的符号检验,其步骤如下:单样本场合的符号
14、检验,其步骤如下:作出假设;作出假设;计数;计数;确定拒绝域;确定拒绝域;选择选择n+,n-较大者,再与临界值比较较大者,再与临界值比较 判断判断 例例6-11(P172):假设随机抽取):假设随机抽取20名工人,他们名工人,他们一天生产的产品件数如下:一天生产的产品件数如下:试以的显著性水平试以的显著性水平=0.05,判定总体中位,判定总体中位数是否为数是否为160。1234567891016616216017216216815215316716611121314151617181920164142173166160165171186167169 符号检验符号检验 配对样本场合的符号检验,其
15、步骤如下:配对样本场合的符号检验,其步骤如下:作出假设作出假设 计数计数 确定拒绝域确定拒绝域 比较正号个数与临界值的大小比较正号个数与临界值的大小 判断判断 例例6-12(P173):假定在体操比赛中,甲乙两位):假定在体操比赛中,甲乙两位裁判分别对该项赛事中的裁判分别对该项赛事中的11位运动员打分,并且位运动员打分,并且记分制为记分制为10分,分值如下表:分,分值如下表:给定显著性水平给定显著性水平=0.05,试用符号检验法,试用符号检验法检验这两位裁判判定的成绩是否有显著性检验这两位裁判判定的成绩是否有显著性差异。差异。1234567891011裁判甲8.19.08.89.37.99.1
16、8.68.88.49.29.1裁判乙7.38.88.69.48.49.08.98.78.09.29.5差值符号+0 秩和检验秩和检验考虑了差数的顺序考虑了差数的顺序 主要步骤:主要步骤:作出假设作出假设 求秩和求秩和 确定拒绝域确定拒绝域 比较秩和与临界值的大小比较秩和与临界值的大小 判断判断 例例6-13(P147):甲乙两家公司供应同一种商品):甲乙两家公司供应同一种商品,两家商品的价格与性能一致。但使用寿命是否,两家商品的价格与性能一致。但使用寿命是否一致有待检验。现在分别从两家商品中抽出样本一致有待检验。现在分别从两家商品中抽出样本,测定商品保用寿命数据如下表所示:,测定商品保用寿命数据如下表所示:试以试以0.05的显著性水平,检验两家公司的商品寿的显著性水平,检验两家公司的商品寿命是否差异。命是否差异。甲公司商品甲公司商品51169710乙公司商品861078 游程检验游程检验 游程:就是一个重复出现的某一类字符串片段。同一游程:就是一个重复出现的某一类字符串片段。同一类游程出现的次数,称游程数。不同类游程数的和,类游程出现的次数,称游程数。不同类游程数的和,称为总游程数。称