统计学抽样与抽样分布.ppt

上传人:p** 文档编号:184973 上传时间:2023-04-04 格式:PPT 页数:67 大小:1.29MB
下载 相关 举报
统计学抽样与抽样分布.ppt_第1页
第1页 / 共67页
统计学抽样与抽样分布.ppt_第2页
第2页 / 共67页
统计学抽样与抽样分布.ppt_第3页
第3页 / 共67页
统计学抽样与抽样分布.ppt_第4页
第4页 / 共67页
统计学抽样与抽样分布.ppt_第5页
第5页 / 共67页
统计学抽样与抽样分布.ppt_第6页
第6页 / 共67页
统计学抽样与抽样分布.ppt_第7页
第7页 / 共67页
统计学抽样与抽样分布.ppt_第8页
第8页 / 共67页
统计学抽样与抽样分布.ppt_第9页
第9页 / 共67页
统计学抽样与抽样分布.ppt_第10页
第10页 / 共67页
亲,该文档总共67页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《统计学抽样与抽样分布.ppt》由会员分享,可在线阅读,更多相关《统计学抽样与抽样分布.ppt(67页珍藏版)》请在第壹文秘上搜索。

1、第四章 抽样与抽样分布4.1 抽样的基础知识4.2 抽样分布 4.3 中心极限定理的应用14.1 抽样的基础知识一、 几个概念二、抽样误差三、常用的抽样方法2一、几个概念(一)全及总体与总体指标(一)全及总体与总体指标全及总体全及总体。简称总体简称总体(Population)(Population),是指所要研究的,是指所要研究的对象的全体,它是由所研究范围内具有某种共同性质对象的全体,它是由所研究范围内具有某种共同性质的全部单位所组成的集合体。总体单位总数用的全部单位所组成的集合体。总体单位总数用N N表示。表示。(举例)(举例) 总体指标总体指标(参数)。在抽样估计中,用来反映总体数(参数

2、)。在抽样估计中,用来反映总体数量特征的指标称为总体指标,也叫总体参数。量特征的指标称为总体指标,也叫总体参数。研究目的一经确定,总体也唯一地确定了,所以总体研究目的一经确定,总体也唯一地确定了,所以总体指标的数值是客观存在的、确定的,但又是未知的,指标的数值是客观存在的、确定的,但又是未知的,需要用样本资料去估计需要用样本资料去估计。3总体和参数(续)通常所要估计的总体指标有通常所要估计的总体指标有变量总体变量总体属性总体属性总体总体平均数总体平均数 ( (或记为或记为 )总体比例(成数)总体比例(成数)总体标准差总体标准差或方差或方差总体比例标准差总体比例标准差P P或方差或方差P P 总

3、体标志总量总体标志总量 ( )( )总体中具有某一属性的单位总数总体中具有某一属性的单位总数(NP)(NP)等。等。XNX一、 几个概念(二)样本总体与样本指标(二)样本总体与样本指标样本总体样本总体。简称样本(。简称样本(SampleSample),它是按照随机原则,),它是按照随机原则,从总体中抽取的部分总体单位的集合体从总体中抽取的部分总体单位的集合体 。样本容量样本容量:样本中所包含的个体的数量,一般用:样本中所包含的个体的数量,一般用n n表示。表示。在实际工作中,人们通常把在实际工作中,人们通常把n30n30的样本称为大样本的样本称为大样本,而把而把n30nn) 分层抽样把异质性较

4、强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。等距抽样把总体的单位进行排序,然后按照固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。整群抽样抽样的单位不是单个的个体,而是成群的个体。 多阶段抽样把抽样过程分为几个阶段进行。适用于总体规模特别大,或者总体分布的范围特别广时 非概率抽样n也叫非随机抽样,是指从研究目的出发,根据调查者的经验或判断,从总体中有意识地抽取若干单位构成样本。n重点调查、典型调查、配额抽样(是按照一定标准或一定条件分配样本单位数量,然后由调查者在规定的数额内主观地抽取样本)、方便抽样(指调查者按其方便

5、任意选取样本。如商场柜台售货员拿着厂家的调查表对顾客的调查)等就属于非随机抽样。n优点:优点:及时了解总体大致情况,总结经验教训,在进行大规模抽样调查之前的试点。n缺点:缺点:非随机抽样容易产生倾向性误差,并且误差不能计算和控制 ,也就无法说明调查结果的可靠程度。概率抽样与非概率抽样抽样类型抽样类型概率抽样非概率抽样简单随机抽样分层随机抽样整群抽样系统抽样方便抽样判断抽样其他非概率抽样多阶段抽样重复抽样与非重复抽样n重复抽样,又称回置抽样,是指从总体的N个单位中,每次抽取一个单位后,再将其放回总体中参加下一次抽选,连续抽n次,即得到一个样本。n特点:样本是由n次相互独立的连续试验构成的,每次试

6、验是在完全相同的条件下进行,每个单位中选的机会在各次都完全相等。n“重抽”(考虑顺序)可能的样本数目(从总体中可能抽取的样本个数,用M表示)为:Nn个。重复抽样与非重复抽样n不重复抽样,也叫不回置抽样,是指抽中的单位不再放回总体中,下一个样本单位只能从余下的总体单位中抽取。n特点特点:样本由n次连续抽取的结果构成,实际上等于一次同时从总体中抽取n个样本单位。 n次抽取结果不是独立的n 可能的样本数目(考虑顺序): N(N-1)(N-2)(N-n+1)个。重复抽样与非重复抽样n设有设有4 4名学生的月消费支出分别为:名学生的月消费支出分别为:240240,280280,360360,400400

7、元。我们分别用元。我们分别用A A、B B、C C、D D替代。若从替代。若从中抽取两个单位构成样本,则全部可能的样本数中抽取两个单位构成样本,则全部可能的样本数目为:目为:n重复:重复:4 42 2=16=16个。它们是个。它们是 n AA AB AC AD; BA BB BC BD AA AB AC AD; BA BB BC BD n CA CB CC CD; DA DB DC DD CA CB CC CD; DA DB DC DDn不重复:不重复:4 43=123=12。它们是。它们是 n AB AC AD; BA BC BDAB AC AD; BA BC BDn CA CB CD; D

8、A DB DC CA CB CD; DA DB DC 抽样误差n统计调查误差统计调查误差,是指调查,是指调查所得结果与总体真实所得结果与总体真实数值之间的差异数值之间的差异。n 登记性误差登记性误差。是任何一种统计调查都可能产生。是任何一种统计调查都可能产生。 n 代表性误差代表性误差n系统性误差系统性误差:是由于非随机因素引起的:是由于非随机因素引起的 样本代表样本代表性不足而产生的误差,表现为样本估计量的值系性不足而产生的误差,表现为样本估计量的值系统性偏高或偏低,故也称偏差;统性偏高或偏低,故也称偏差;n随机误差随机误差:又称偶然性误差,是指:又称偶然性误差,是指遵循随机原则遵循随机原则

9、抽样,但由于样本各单位的结构不足以代表总体抽样,但由于样本各单位的结构不足以代表总体各单位的结构而引起的样本估计量与总体参数之各单位的结构而引起的样本估计量与总体参数之间的误差间的误差。这就是抽样估计中所谓的抽样误差。这就是抽样估计中所谓的抽样误差 。二、抽样误差实际应用中,有三个密切联系而又相互区别实际应用中,有三个密切联系而又相互区别的抽样误差的概念的抽样误差的概念 实际抽样误差实际抽样误差 抽样平均误差抽样平均误差 抽样极限误差抽样极限误差29二、抽样误差(二)抽样平均误差(抽样标准误(二)抽样平均误差(抽样标准误)抽样平均误差是反映抽样误差一般水平的指标(抽样平均误差是反映抽样误差一般

10、水平的指标(因为因为抽样误差是一个随机变量,它的数值随着可能抽取的抽样误差是一个随机变量,它的数值随着可能抽取的样本不同而或大或小,为了总的衡量样本代表性的高样本不同而或大或小,为了总的衡量样本代表性的高低,就需要计算抽样误差的一般水平低,就需要计算抽样误差的一般水平)。通常用)。通常用样本样本估计量的标准差估计量的标准差来反映来反映所有可能样本估计值与其中心所有可能样本估计值与其中心值的平均离散程度。值的平均离散程度。 30二、抽样误差(二)抽样平均误差(二)抽样平均误差22( )()( )x E xxxMMn抽样平均误差可衡量样本对总体的代表性大小抽样平均误差可衡量样本对总体的代表性大小。

11、即即:抽样平均误越小,则样本估计量的分布就越集抽样平均误越小,则样本估计量的分布就越集中在总体参数的附近,平均来说,样本估计值与总中在总体参数的附近,平均来说,样本估计值与总体参数之间的抽样误差越小,样本对总体的代表性体参数之间的抽样误差越小,样本对总体的代表性越大。越大。31抽样平均误的计算公式抽样平均误的计算公式在总体方差在总体方差 已知,总体单位总数为已知,总体单位总数为N N,样本,样本容量为容量为n n,简单随机抽样条件下,抽样平均误,简单随机抽样条件下,抽样平均误的计算公式为的计算公式为: 重复抽样重复抽样 不重复抽样不重复抽样估计均值估计均值估计成数估计成数22( ) xnn2(

12、 )1nxnN(1)( )pppn(1)( )1ppnpnN32二、抽样误差(三)抽样极限误差(三)抽样极限误差抽样极限误差是指抽样极限误差是指一定概率下一定概率下抽样误差的抽样误差的可能范围可能范围,也称为也称为允许误差允许误差。用。用表示,由定义知其表达式:表示,由定义知其表达式:在一定概率下,在一定概率下, 上式表示,在一定概率下可认为样本估计量与相应的上式表示,在一定概率下可认为样本估计量与相应的总体参数的误差的绝对值不超过总体参数的误差的绝对值不超过 。 33抽样极限误差抽样极限误差用用 、 分别表示平均数和比率(成数)的抽样极限分别表示平均数和比率(成数)的抽样极限误差,则在一定概

13、率下有:误差,则在一定概率下有:估计均值的置信区间:估计均值的置信区间:估计成数(比例)的置信区间:估计成数(比例)的置信区间: xpxXxpPpxxxXx pppPp 34对抽样极限误差的解释:抽样极限误差抽样极限误差是抽样误差的是抽样误差的可能范围可能范围,而不是完全肯,而不是完全肯定的范围。所以,这一可能范围的大小是与其估计的定的范围。所以,这一可能范围的大小是与其估计的可靠程度的大小(即概率)紧密联系的。在抽样估计可靠程度的大小(即概率)紧密联系的。在抽样估计中,这个概率叫置信度,习惯上也称为可靠程度、把中,这个概率叫置信度,习惯上也称为可靠程度、把握程度或概率保证程度等,用握程度或概

14、率保证程度等,用1-1-表示。表示。显然在其他显然在其他条件不变的情况下,抽样极限误差越大,相应的置信条件不变的情况下,抽样极限误差越大,相应的置信度也就越大。度也就越大。35抽样误差率:抽样误差率:与抽样极限误差相关的两个概念是与抽样极限误差相关的两个概念是: : 抽样误差率和抽样估计精度抽样误差率和抽样估计精度抽样误差率抽样误差率= =(抽样极限误差(抽样极限误差/ /估计量)估计量)100%100%抽样估计精度抽样估计精度=100%-=100%-抽样误差率抽样误差率36估计精度(准确性)与可靠程度的关系:估计精度与估计的可靠程度是矛盾的。也就是说,如估计精度与估计的可靠程度是矛盾的。也就

15、是说,如果果精度很高精度很高,则会由于估计区间太窄而使错误估计的,则会由于估计区间太窄而使错误估计的可能性大增,从而大大降低估计的可靠程度,使估计可能性大增,从而大大降低估计的可靠程度,使估计结果没有多大的作用;如果结果没有多大的作用;如果置信度很高置信度很高,则意味着允,则意味着允许误差范围较大,而使估计精度太低许误差范围较大,而使估计精度太低 ,这时尽管估计,这时尽管估计的可靠程度接近或等于的可靠程度接近或等于100%100%,但抽样估计本身也会失,但抽样估计本身也会失去意义。去意义。实际中,只能依据具体情况,先满足一方面,然后确实际中,只能依据具体情况,先满足一方面,然后确定另一方面。定

16、另一方面。37 抽样分布的概念样本指标是一种随机变量,它有若干可能取值,每样本指标是一种随机变量,它有若干可能取值,每个可能取值都有一定的可能性(即概率),从而形成个可能取值都有一定的可能性(即概率),从而形成它的概率分布,即统计上所谓的抽样分布。简言之,它的概率分布,即统计上所谓的抽样分布。简言之, 抽样分布就是指抽样分布就是指样本统计量样本统计量的概率分布的概率分布。样本统计量是由样本统计量是由n n个随机变量构成的函数,故抽样分布个随机变量构成的函数,故抽样分布属于随机变量函数的分布。属于随机变量函数的分布。38一、 抽样分布的概念举例举例: : 四名学生的月生活费支出(四名学生的月生活费支出(480480,560560,720720,800 800 元)。现按不重复取样的方法,随机抽取两位构元)。现按不重复取样的方法,随机抽取两位构成一个样本,则全部可能的样本及其各样本的均值如成一个样本,则全部可能的样本及其各样本的均值如下表所示:下表所示:39序序 样本变量样本变量 样本平均数样本平均数 平均数离差平均数离差 离差平方离差平方 x -x -E( E( ) -) -E( E(

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 统计学

copyright@ 2008-2023 1wenmi网站版权所有

经营许可证编号:宁ICP备2022001189号-1

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第壹文秘网,我们立即给予删除!