《第7章抽样和抽样分布.ppt》由会员分享,可在线阅读,更多相关《第7章抽样和抽样分布.ppt(63页珍藏版)》请在第壹文秘上搜索。
1、1第七章第七章 抽样和抽样分布抽样和抽样分布 n学习目标n掌握简单随机抽样方法。n了解点估计的基本方法。n掌握样本均值和样本比例的抽样分布2习习 题题1.P210-15 4.P220-292.P219-19 5.P221-323.P220-25 6.P225-433n案例讨论:案例讨论:n1.阅读本案例时,你抓住了其中哪些重要内容?n2.阅读完本案例你的最大收获是什么?4第一节第一节 新烽电子公司新烽电子公司公司抽样问题的案例公司抽样问题的案例n问题:n 新烽电子公司的人事部门经理要拟订一份公司2500名经理的简介。内容包括经理们的平均年薪和已完成公司培训计划的经理所占比例。5n背景:n 假定
2、这项工作已经做完,获取总体的信息包括:n (1)总体的平均年薪为51800元n (2)有1500名经理完成了培训计划60.025001500p6n事件:事件:n 人事部门经理不想用全面调查而是抽样的方法,从2500名经理中抽取30名来估计总体信息。n分析:分析:n 以下内容将围绕这一案例的分析、解决展开。7第二节第二节 简单随机抽样简单随机抽样 n 简单随机抽样简单随机抽样(Simple random sampling)是最常用的一种抽样方法。它的定义和样本抽取程序取决于总体是有限总体还是无限总体。8一、有限总体抽样一、有限总体抽样n(一)有限总体的含义n 可以列出或计数总体中所有元素(单位)
3、的总体称为有限总体有限总体。9一、有限总体抽样一、有限总体抽样 n(二)简单随机样本定义 n从容量为N的有限总体中进行抽样,如果容量为n的每个可能样本被抽到的机会相同,我们称容量为n的样本为简单随机样本。10n(三)抽样方法n1.无放回抽样n 无放回抽样无放回抽样(Sampling without replacement)一个元素一旦选入样本,就从总体中剔除,不能再次被选入。n例例7.1 在新烽电子公司的问题中,用无放回抽样方法抽取样本。11n分析:分析:n 在此问题中,N=2500,n=30。用无放回抽样方法抽取样本的方法步骤如下:n(1)抽样的准备工作n第一步:将2500名新烽电子公司经理
4、编号1,2,3,2499,2500。n第二步:将每个号码写在大小相等的纸片上,并揉成均匀的球状。n第三步:每个纸球放入圆形容器中摇匀。12n(2)具体抽样n 第一步:从2500个纸球中随机抽取1个,做好编号记录,然后将其放在一边。n 第二步:从剩下的2499个纸球中再抽取另1个,做好记录后再放在一边。n 第三步:以此类推,直至抽够30个为止。n 由此就构成一个无放回抽样的简单随机样本。132.放回抽样n 放回抽样放回抽样(Sampling with replacement)一个元素一旦选入样本,仍被放回总体中。先前被选入的元素可能再次被选,并且在样本中可能出现多次(多于一次)。n 例例7.27
5、.2 在新烽电子公司问题中,用放回抽样方法抽取样本。14n分析:分析:n 抽样的准备工作同无放回抽样。n 具体抽样:n 第一步:从2500个纸球中随机抽取第1个,做好编号记录,然后将其放回总体参加下一次抽选。n 第二步:从2500个纸球中再随机抽取第2个,做好编号记录,然后将其放回总体参加下一次抽选。n 第三步:以此类推,直至抽够30个为止。15n 最常用的抽样方法是无放回抽样。n 以后,只要提到简单随机抽样,就假定是无放回抽样。16n(四)利用随机数表抽取元素(见附录B表8,P474)n 例例7.3 在新烽电子公司问题中,利用随机数表抽取元素组成无放回抽样简单随机样本。n见教科书P205。1
6、7最终抽取结果最终抽取结果 1599 1102 1514 1807 1458 1355 1508 1041 2003 0637 1976 1665 1022 0246 0671 2245 2162 1861 0483 0378 1318 1900 0290 0127 0493 0644 0157 2295 2069 2375 18n每500个元素中被抽中的个数n1500,7个n5001000,3个n10001500,6个n15002000,8个n20002500,6个19n(五)从容量为N的总体中抽取n个元素作为一个简单随机样本所产生不同样本的个数(不考虑顺序的无放回抽样)!nNnNCMnNM
7、:有可能产生的样本个数。20n例例7.4计算从容量为10的总体中抽取3个元素作为一个简单随机样本所产生不同样本的个数。120126712312910!nNnNM21二、无限总体抽样二、无限总体抽样n(一)无限总体的含义n 无法列出或计数总体中所有元素(单位)的总体称为无限总体无限总体。22二、无限总体抽样二、无限总体抽样 n (二)无限总体简单随机样本定义 n 满足下面条件的样本称为无限总体简单随机样本:n(1)每个个体都来自同一个总体。n(2)每个个体被抽取是相互独立的。23n例如例如:n 我们要估计上午11:30到下午1:30午餐期间,顾客在某快餐店从订购到拿到食物的平均时间。n分析:分析
8、:n 总体是午餐期间所有可能来的顾客。这一总体就是一个无限总体。其中,我们的任务就是从这个总体中抽取n名顾客组成一个简单随机样本。24n某快餐店抽样程序:某快餐店抽样程序:n 将紧跟在用折扣优惠券购买食物顾客后面的那名顾客作为抽取的对象。这样,用折扣优惠券购买食物顾客是随机的,也是相互独立的。如此抽取的元素满足上述两个条件。25第四节第四节 抽样分布抽样分布 n 抽样分布抽样分布(Sampling distribution)样本统计量所有可能值构成的概率分布。n 对于一个容量为N的总体,抽取样本容量为n的样本数目可能有m个。每个简单随机样本都有一个样本均值和一个样本比例。n 这些样本均值构成的
9、概率分布就称为 样本均值的抽样分布样本均值的抽样分布;n这些样本比例构成的概率分布就称为样本样本比例的抽样分布比例的抽样分布。26第五节第五节 的抽样分布的抽样分布 x总体均值?从总体中抽取一个容量为n的样本计算出样本均值推断27一、一、的期望值的期望值 x xE(7.2)公式(7.2)说明,是 的无偏估计。x28 无偏性无偏性(Unbiasedness)点估计量的一个性质。点估计量的数学期望等于所估总体参数的值。例如,在新烽电子公司问题中,新烽电子司经理年薪总体均值 ,所以根据公式(7.2)可以认为,所有可能样本均值的均值(元)51800元51800 x二、二、的标准误差的标准误差x29n(
10、一)无限总体的标准误差(放回抽样)nx(7.3)(二)有限总体的标准误差(无放回抽样)1NnNnx(7.4)30抽样分布的标准误差:xx:总体均值的标准差NnNnNNnN111:有限总体的校正因子31(三)计算 的标准误差经验法则x只要满足以下两个条件之一:1.总体是无限的。2.总体是有限的,但 05.0Nn用 计算 的标准误差。nxx32n例例7.5在新烽电子公司问题中,假定4000求:x分析:分析:由于抽样比由于抽样比 05.0012.0250030Nn所以可以直接用所以可以直接用 计算计算 nx元30.730304000nx33n730.3元的含义:n 在新烽电子公司抽样问题的案例中,2
11、500名经理们年薪平均数,在样本容量为30的情况下,所有样本的均值与总体均值之差的平均数为730.3元。34三、三、中心极限定理中心极限定理 n 识别样本均值抽样分布特征的最后一步是确定概率分布的类型。n 在用样本均值推断总体均值时会遇到以下两种情形:n (1)总体分布未知;n (2)总体分布已知且为正态分布。n 当总体分布未知时,我们要借助于中心极限定理。x35n中心极限定理(Central Limit theorem)从总体中抽取样本容量为n的简单随机样本,当样本容量很大时,样本均值的抽样分布可以近似看成正态分布。n参阅教材(P216图7.5)。36n 这一命题要解决的问题就是,根据抽样误
12、差确定在一次抽样中,样本均值落在以总体均值为中心,左右分别小于(等于)和大于(等于)一个数据范围内的概率有多大。四、四、抽样分布的实际值抽样分布的实际值x37样本均值抽样误差的概念样本均值抽样误差的概念n 样本均值与总体均值之差的绝对值称作抽样误差(单个样本的抽样误差)(单个样本的抽样误差)。x38n例例7.6 在新烽电子公司问题中,假定人事部经理把样本均值落在总体均值左右各500元以内作为一个可接受的估计值。那么,根据30名经理组成的简单随机样本得到的样本均值在总体均值左右500元以内的概率有多大呢?分析:人事部经理需要了解的是,样本均值在5130052300元之间的概率有多大(总体均值为5
13、1800元)。39n 由于抽样分布是正态的,n则我们可以通过标准化,利用标准正态分布表查出此概率,即元51800元3.73068.03.7305180052300z40n查标准正态分布表得(查标准正态分布表得(P452):):2518.068.00 zp41n 由于标准正态分布是对称分布的,所以当计算 时,美元51300 x2518.000.068.0zp68.068.0zp00.068.0zp68.00 zp=0.2518+0.2518=0.503642n结论结论:上述计算结果表明,人事部经理有50.36%的把握保证由30名新烽电子公司经理组成的样本,他们平均年薪在5130052300元之间
14、。43图7.7 样本均值在总体均值左右500元范围之间的概率 44五、样本容量与抽样分布之间的关系五、样本容量与抽样分布之间的关系 n由 公式可以看出,均值的标准误差与样本容量的平方根有关。即当样本容量增加时,均值的标准误差会减少。nx例如,当n=30时,新烽电子公司问题均值标准误差为730.30,当样本容量增加到100 时,则新烽电子公司问题均值标准误差减少到 4001004000nx45n在 的情况下,由100名新烽电子公司经理组成的简单随机样本所得到样本均值落在总体均值左右500元之间的概率。100n25.14005180052300z查标准正态分布表查标准正态分布表 3944.025.
15、100.0 zp46n 由此,样本均值在5130052300元之间的概率为:0.3944+0.3944=0.7888图7.8 简单随机样本均值的抽样分布比较(样本由 和 名新烽电子公司经理组成)30n100n47第六节第六节 样本比例样本比例的抽样分布的抽样分布 n 在许多商务和经济领域中,决策人员还经常要用样本比例对总体比例进行统计推断。这一过程我们用图7.9来描述。48总体比例P=?从总体中抽取容量为n的样本计算样本比例p推断49一、样本比例的期望值一、样本比例的期望值 PpE 公式(7.5)说明,p的所有可能取值的平均值等于总体比例 P 。例如,例如,在新烽电子公司问题中,已经参在新烽电
16、子公司问题中,已经参加了公司管理培训计划的经理所占比例是加了公司管理培训计划的经理所占比例是0.600.60,因此,新烽电子公司抽样问题中的期,因此,新烽电子公司抽样问题中的期望值望值p p0.600.60。(7.5)50二、二、p p的标准差的标准差n(一)无限总体(一)无限总体n (7.6)11NnNnppp(二二)有限总体有限总体nppp1(7.7)51n(三)计算样本比例标准差的经验法则当抽样比当抽样比 时,计算时,计算 用公式用公式(7.7)(7.7)。05.0Nnp 例如例如,在在新烽电子公司新烽电子公司问题中,已经参问题中,已经参加了公司管理培训计划的经理所占比例是加了公司管理培训计划的经理所占比例是0.600.60,因为,因为 05.0012.0250030Nn0894.008.03060.0160.01nppp52三、三、p p的抽样分布的类型的抽样分布的类型n利用中心极限定理判定p的抽样分布的类型。当样本容量很大时,就可以将 p的抽样分布近似看成正态概率分布。大样本容量的标准:大样本容量的标准:515pnnp53n例如,例如,在新烽电子公司问题中,由于 60.030