《第4章统计推断.ppt》由会员分享,可在线阅读,更多相关《第4章统计推断.ppt(55页珍藏版)》请在第壹文秘上搜索。
1、第四章 统计推断第一节 假设检验的方法第二节 单个样本平均数假设测验第三节 两个样本平均数假设测验第四节 参数的区间估计学习目的理解假设检验与区间估计的原理理解假设检验与区间估计的原理掌握假设检验的步骤掌握假设检验的步骤对实际问题进行统计测验及总体参数估对实际问题进行统计测验及总体参数估计计第一节 假设检验的方法统计推断的概念总体总体样本样本1 1样本样本2 2样本样本n n总体总体参数参数统计数统计数抽样分布抽样分布统计推断统计推断一.统计推断的概念统计推断:是指根据已知统计推断:是指根据已知样本样本的特征特性,推的特征特性,推断断总体总体的特征特性。的特征特性。统计推断能排除试验误差影响,
2、揭示出事物的统计推断能排除试验误差影响,揭示出事物的内在规律。内在规律。假设检验假设检验 参数估计参数估计2.统计推断在统计方法中的地位统计方法统计描述统计推断假设检验参数估计例例 某地区的当地小麦品种一般某地区的当地小麦品种一般亩产产300kg,其标准差,其标准差为75kg,现有某新品种通过,现有某新品种通过25个小区的试验,计得其样本个小区的试验,计得其样本平均产量为每平均产量为每亩330kg,问新品种产量与当地品种产量是问新品种产量与当地品种产量是否有显著差异?否有显著差异?实例假设新品种产假设新品种产量与当地品种量与当地品种产量无差异产量无差异=300=300 x=330=300=30
3、0抽样分布+1.96样本均值样本均值330330我们是拒绝还是接受我们是拒绝还是接受=300=300?假设宣称的叙述为假设宣称的叙述为真(假设新品种产量与当地品真(假设新品种产量与当地品种产量无差异,即种产量无差异,即x=330属于属于N(300,75)总体)总体),如果如果推得实验结果发生的可能性很低,推得实验结果发生的可能性很低,则则叙述不真。叙述不真。“小概率原则小概率原则”是指小概率事件在一次观测或试验是指小概率事件在一次观测或试验中一般是不会发生的。如果在一次观测中,小概率中一般是不会发生的。如果在一次观测中,小概率事件居然发生了,我们就有理由认为这个现象是不事件居然发生了,我们就有
4、理由认为这个现象是不合适的。合适的。3.假设测验的理论基础假设测验的理论基础1.假设:对总体参数的一种看法假设:对总体参数的一种看法 无效假设(或零假设无效假设(或零假设 null hypothesis 备择假设(或对立假设备择假设(或对立假设alternative hypothesis)二、假设测验的步骤如,假设我们所研究的样本是来自指定的总如,假设我们所研究的样本是来自指定的总体,这称为无效假设。体,这称为无效假设。常表示的形式有:常表示的形式有:H0:=0 H0:=C H0:1-2=0 H0:1什么是无效假设与无效假设对立的假设。与无效假设对立的假设。常表示的形式有:常表示的形式有:HA
5、:0 HA:C HA:1-20 HA:1什么是备择假设2.确定显著水平Significance Level 用来推断无效假设否定与否的概率标准叫做用来推断无效假设否定与否的概率标准叫做显著水平显著水平 研究者根据试验的要求和试验的结论的重要性而定研究者根据试验的要求和试验的结论的重要性而定 试验中难以控制的因素较多,试验误差可能试验中难以控制的因素较多,试验误差可能较大,则较大,则取大值取大值。如果试验耗费较大,对精。如果试验耗费较大,对精确度要求较高,不容许反复,则确度要求较高,不容许反复,则取小值取小值。=0.05时否定原假设时否定原假设,称差异性是称差异性是显著的显著的显著性检显著性检验
6、验=0.01时否定原假设时否定原假设,称差异性是称差异性是极显著的极显著的3.测验计算1、在无效假设正确的假定下,依据统计数的抽、在无效假设正确的假定下,依据统计数的抽样分布,计算样本平均数的出现概率。样分布,计算样本平均数的出现概率。2、确定适当的测验统计量、确定适当的测验统计量n是大样本还是小样本是大样本还是小样本n总体方差已知还是未知总体方差已知还是未知(1 1)已知时已知时的假设检验的假设检验在在H H0 0:=0 0成立时有成立时有(2 2)未知时未知时的假设检验的假设检验当当n30n30时近似服从正态分布时近似服从正态分布当当n30n34g。2.取显著水平取显著水平 =0.05。3
7、.概率计算:概率计算:g.s641188318=1 640 588x.s.g=069258034235.t=(35 637 634 6)8281 7 835 2x././.g=83188)7281(6346376352222./.SS=4.统计推断:统计推断:查附表查附表,df=7时,时,t=2.069t0.05=1.895。故。故P0.05。5.推断:拒绝推断:拒绝H0:34g,即新引入品种千粒重显,即新引入品种千粒重显著高于当地良种。著高于当地良种。假设测验的理论基础为假设测验的理论基础为u“小概率事件实际不可能原理小概率事件实际不可能原理”u样本平均数的抽样分布样本平均数的抽样分布样本平
8、均数的抽样分布a、从正态总体抽取的样本,无论样本容量多大,其从正态总体抽取的样本,无论样本容量多大,其样本平均数样本平均数x x的抽样分布必成正态分布。的抽样分布必成正态分布。b b、不是正态分布,当样本容量、不是正态分布,当样本容量n n足够大时,从这一总足够大时,从这一总体抽出样本平均数体抽出样本平均数x x的分布趋于正态分布。的分布趋于正态分布。c c、不是正态分布,当样本容量、不是正态分布,当样本容量n n较小时,样本平均数较小时,样本平均数x x的分布趋于的分布趋于t t分布。分布。(1 1)已知时已知时的假设检验的假设检验在在H H0 0:=0 0成立时有成立时有(2 2)未知时未
9、知时的假设检验的假设检验当当n30n30时近似服从正态分布时近似服从正态分布当当n30n30时服从时服从t t分布分布)(1,0Nu0nX=)(1,0Nu0nSX=)(1tt0=nnSX 已知普通水稻单株产量符合正态分布已知普通水稻单株产量符合正态分布N(250,2.782)。现测得)。现测得10株杂交水稻单株产量分株杂交水稻单株产量分别为别为272、200、268、247、267、246、363、216、206、256。问杂交稻单株产量。问杂交稻单株产量与普通水稻单株产量是否有差异?与普通水稻单株产量是否有差异?两尾测验与一尾测验假设双尾测验左尾测验右尾测验H0=000HA00H H0 0抽
10、样分布接收区接收区样本均值样本均值1-1-拒绝区拒绝区拒绝区拒绝区H H0 0抽样分布接收区接收区样本均值样本均值1-1-拒绝区拒绝区临界值临界值假设测验的两类错误客观实际客观实际检验结果检验结果错误名称错误名称犯错误概率犯错误概率H0正确正确拒绝拒绝H0弃真错误弃真错误 I型型 H0错误错误接受接受H0纳伪错误纳伪错误II型型 (1)选取适当的选取适当的值:值:选取数值小的选取数值小的值,值,如从如从5%变为变为1%,可以降低犯,可以降低犯I型错误的概率,但是将增大第二类错误型错误的概率,但是将增大第二类错误的概率。的概率。(2)增加试验重复次数:增加试验重复次数:如果显著水平如果显著水平已
11、固定下来,则已固定下来,则改进试验技术和增加样本容量,提高试验的精确度,可以改进试验技术和增加样本容量,提高试验的精确度,可以有效地降低犯第二类错误的概率。有效地降低犯第二类错误的概率。(3)对于田间试验,由于试验条件不容易控制,试验误对于田间试验,由于试验条件不容易控制,试验误差较大,应选取较高差较大,应选取较高值,以降低犯值,以降低犯II型错误的概率。型错误的概率。关于两类错误的讨论可总结如下:关于两类错误的讨论可总结如下:由两个样本平均数的相差,以测验这两个样本所属由两个样本平均数的相差,以测验这两个样本所属的的总体平均数有无显著差异总体平均数有无显著差异。测验方法测验方法 成组数据成组
12、数据的平均数比较的平均数比较 成对数据成对数据的比较的比较 第三节 两个样本平均数的假设测验表表1 1 朱顶红小花直径测量值朱顶红小花直径测量值 单位单位cmcm大花直径443.873.573.783.953.93.63.853.95黄花直径3.633.753.774.053.983.94.253.924.24.12表表2 2 两种栽培方法的地瓜产量两种栽培方法的地瓜产量 单位(单位(kg/亩)亩)有机有机2722.22722.22866.72866.72675.92675.92169.22169.22253.92253.92315.12315.1标准标准951.4951.4141714171
13、275.31275.32228.52228.52462.62462.62715.42715.4(一一)成组数据的平均数比较成组数据的平均数比较 1.u检验检验 两个样本总体方差已知,或总体方差未知,两个样本总体方差已知,或总体方差未知,但为大样本时采用但为大样本时采用 例例1 已知早稻佳辐品种已知早稻佳辐品种2 2=1.35=1.35,用,用A A、B B两种方两种方法取样,法取样,A A取取1515个样点,平均产量个样点,平均产量x x1 1=7.69=7.69;B B法取法取9 9个样点,平均产量个样点,平均产量x x2 2=8.77=8.77。检验两种取样法测得。检验两种取样法测得的小区
14、产量是否有差异?的小区产量是否有差异?22212121nnxx=2121uxxxx=2.t检验检验在两个样本的总体方差未知(在两个样本的总体方差未知(1 12 2=2 22 2=2 2 ),且为小样本时,用,且为小样本时,用t检验检验在两个样本的总体方差未知(在两个样本的总体方差未知(1 12 22 22 2 2 2 ),且为小样本时,用近似,且为小样本时,用近似t检验检验两个总体方差的检验F检验 对于来自于两个总体的样本,其总体方差分别为12和22,从两个总体中独立抽取容量为n1和n2的样本,对应样本的方差分别为S12与S22。该统计量服从分子自由度为n1-1,分母自由度n2-1的F分布。2
15、221SSF=1、它是一种非对称分布,取值范围是(、它是一种非对称分布,取值范围是(0,+););2、它有两个自由度,求、它有两个自由度,求F时,将数值大的均方放在分子,时,将数值大的均方放在分子,数值小的均方放在分母;数值小的均方放在分母;3、F分布是随自由度变化的一簇偏态,不同的自由度决定分布是随自由度变化的一簇偏态,不同的自由度决定了了F 分布的形状。分布的形状。例,某厂家从两个供货商进货,分别是货物A和货物B。已经列出两种货物的样本数据,如表所示。问货物A的重量波动是否明显高于货物B。货物货物A重量重量114114116116104104100100979711811883831151
16、15949410810812812893939797107107108108107107989883831051059393111111107107888898987676115115118118112112116116121121979712612698981221229797104104109109111111111111104104货物货物B重量重量13113110210287871291291431431171171071079696116116140140120120122122113113117117137137123123131131119119113113132132128128117117110110110110129129125125969695951261261231231021021101101171171351358989在两个样本的总体方差未知(在两个样本的总体方差未知(1 12 2=2 22 2=2 2 ),且为小样本时,用),且为小样本时,用t检验检验 例2 测得马铃薯两个品种鲁引1号和大西洋的块茎干物质含量结果如表,检验两个品种马铃薯的块茎干物质含量有