《抽样调查第6章整群抽样与系统抽样.ppt》由会员分享,可在线阅读,更多相关《抽样调查第6章整群抽样与系统抽样.ppt(26页珍藏版)》请在第壹文秘上搜索。
1、6.1 整群抽样6.2 群内相关系数6.3 系统抽样6.4 个体指标具有特殊结构时的系统抽样6.5 系统抽样估计量方差的估计整群抽样的提法目标量的估计u整群抽样的提法与特点 在多阶抽样中,当某一单元被抽中,对该单元包含的下一级抽样单元不再抽样,而是进行普查 l抽样框要求简单 l样本相对集中,方便调查 l特定场合具有较高精度 因为样本集中,可增大样本量弥补精度上的损失 群内次级单元差异很大反映总体分布时,其精度不见得低 u整群抽样的适用场合表6.1 可能适合整群抽样的实例某个城市住户特征住宅街区某个城市某项消费城市居民住宅区某机场旅游信息离开的旅客某大学就业计划学生班级某 乡社会态度成年村民村城
2、市土地所有者档案税务信息土地所有者分类台帐页航班u将整群抽样看作二阶抽样的特例kiNjjiiYkKYY11CSE)1(的无偏估计为定理6.1 对简单随机抽样的整群抽样,总体总数Y的估计有2112CSECSE111)()2(KiNjijKYYKKkkKYVYi的均方偏差为21CSE12CSECSE111)()()3(kiNjjKYYkKkkKYvYVii的一个无偏估计量为kiNjjiiiYpkYY11CPPS11)1(的无偏估计为定理6.2 对有放回PPS整群抽样,总体总数Y的估计有211CPPSCPPS11)()2(KiNjijiiYYppkYVYi的均方偏差为21CPPS1CPPSCPPS1
3、)1(1)()()3(kiNjjYYpkkYvYViii的一个无偏估计量为也可将整群抽样看作单阶抽样,同样可以得到上述两个定理例1 在一次针对某城市大学生月生活费支出的调查中,以小组为群进行整群抽样。每个小组有8名大学生,采用简单随机抽样在510个组中抽取12个小组,全部96个样本大学生月生活费支出数据如表.试估计该城市大学生人均月生活费及其95%的置信区间.例2 调查一片荒地上蝗蝻数量,以一平方米为单位。N=5000,K=500,N0=10,k=20,作简单随机的整群抽样,估计整块荒地蝗蝻数.数据如表 群内相关系数的概念整群抽样的设计效应KiNjijiilijNNljKiiiiYYNYYYY
4、112 1C)()1()(1C达最大值等,则若群内各单元指标均相u群内相关系数群内相关系数是衡量群内单元同质性的一个指标2112CSE0111)(KiNjijKYYKKkkKYV),(111)(11220较大时NKYYKKkkKYVKiNjij时),2,1(0KiNNiC0CSE)1(1)()(DeffNYVYV差得多较大时,整群抽样精度较大,0CN)1(1Deff 0Cn样的二阶抽样有对第一级为简单随机抽设计效应来估计,常用实际当各群容量不等时011NNKKii22C22=111SSNNSS 内内群内相关系数的另一表达式为之间,介于,所以一般有内10 C22SS 221111C211()()
5、(1)()iiiNNKKijijijijNKiijijYYYYNYY 群内相关系数方便计算的另一表达式例3 某县有33个乡,共726个村,某一年度农作物总种植面积为30525亩。先采用等概抽样随机抽出10个乡进行该种作物的产量调查,要求利用无偏估计量和比率估计量(以群规模为辅助变量,以种植面积为辅助变量)分别估计全县总产量,并计算估计量的标准差。数据如表.系统抽样的提法系统抽样的估值法系统抽样的效率个单元依次排列为中的,将总体选一正整数NNK)(直至N为止然后对号码1,2,K作随机抽样,若i入样,则K+i,2K+i,皆入样,组成一个系统样本,3,22,12,2,2,1,21KKKKKKK,若将
6、同一列个体看做一个群,系统抽样可视为整群抽样N不是K整数倍的处理方法1.N/K较大(50)可忽略每群个体差2.将个体单元首位衔接循环取样一般假定N=KN0,并且只从1K中抽选一个样本单元系统抽样的优点是抽样非常方便 将系统抽样看作整群抽样抽取一个一级单元,有由这个思路无法给出其均方偏差的估计量的无偏估计量是YYKYNjj01SYS)1(KiNjijKYYKYV121SYS0)()2(KiiYYNN120u与简单随机抽样的比较2SE)1()(SKNYV20SYS)1()(外SKNNYV22)()1(内SKNNSNN20202)1()1()1(内外KSNSKNSN)()()(22SESYS内SSK
7、NNYVYV系统抽样时,简单随机抽样优于内22SS 随机抽样时,系统抽样优于简单内22SS 时,两者精度相同内22SS u与分层抽样的比较010stNiiiYNNY0112st)()(NiKjijiYYKYVKiNjjNjijYYKYV1211SYS)()(00取一个样本单元个层,每层简单随机抽将总体分为0N)(2)(0001112ljlijiNNliKjNiKjijiYYYYKYYK样,系统抽样优于分层抽0)(001ljlijiNNliKjYYYY例 假设总体有表中的30个单元,欲取5个构成系统样本,与简单随机抽样和分层抽样同样本量的结果进行比较(两种排列方式).个体指标与其次序有线性关系个
8、体指标与其次序有某种周期关系个体的次序随机排列NiiYi,2,1,iYUii/)(设12)1()(11,21122NNUUNSNUNii则12)1()(22SYSKNUVu系统抽样)(21SYSKNNNUu简单随机抽样12)1)(1()(2SEKNNUVu分层抽样12)1()(2StKNKUV此时分层抽样精度最高,系统抽样次之,简单随机抽样精度最低)(MtNt为周期设个体指标以,1,2,12121tYYtYYYttt此时系统抽样估值的精度与K的选取有很大关系,应避免K=t实际呈现精确周期排列的资料是没有的,而具有一定周期性的资料很多,例如季节资料、月度资料、星期资料等对周期资料选择合适K进行系
9、统抽样,可得到比较理想的精度 对总体的某种排列次序,系统抽样精度可能优于简单随机抽样也可能劣于简单随机抽样,但对N个个体的所有N!种排列而言,系统抽样的平均精度与简单随机抽样相等当个体指标具有某种特殊结构时,常对取样方法进行人为调整,有点典型抽样的味道,非完全概率抽样看作简单随机抽样看作分层抽样可用机抽样,将系统抽样看作简单随)(SYSYV来估计,其中当个体单元并非完全随机排列时这个估计会产生偏量:群内相关系数小,会高估均方偏差;群内相关系数大,会低估均方偏差。2002SYS11)(sNNNNYv0120211NjjYYNsv2,v3有很广适用范围,特别是v3为许多实际工作者所采用。2/12)12()2(2SYS2011)(NjjjYYKKYv 将两行个体看作一个层,每层有两个样本单元。两个样本单元构造一个该层的方差估计,再按分层抽样汇总出一个均方偏差的估计022)1(002SYS3)1(2111)(NjjjYYNKNNYv例 调查某单位员工档案工资外的收入情况,该单位有员工660人,备有以出生年月为顺序的花名册。以花名册作为抽样框,拟抽取30个样本单元,故取K=22作系统抽样。从1,2,22中随机取出一数为R=7,入样的单元号码为7,29,623,645。对花名册对应号码的员工进行调查,得当月各人收入资料如表(单位:元),估计每人平均收入及估计量的均方偏差.