《山西联通市场调研的抽样设计.docx》由会员分享,可在线阅读,更多相关《山西联通市场调研的抽样设计.docx(8页珍藏版)》请在第壹文秘上搜索。
1、山西联通市场调研的抽样设计山西信本文从市场调查的实践出发,结合通信市场用户的消费特征与实施调研的数据统计过程,系统地整理并提出了样本量配置的分布表,并在两项有关电信市场的调研中进行了实践,取得了满意的效果。本文的要紧结论对现实的市场研究具有较高的参考价值与简易的可操作性,同时能够很好地保证样本的精确程度,减小抽样误差。不管是全面调查还是抽样调查,样本产生的误差都是不可避免的。因此,为了获得较高精度与较高可靠性的数据,与误差作斗争就成为市场调研最大的课题之一。依照传统的理论习惯,人们在研究实践中通常使用调整样本量与改进抽样技术的方法来减小误差与提高调研的精确度。但问题是,尽管我们能够用较大的样本
2、来弥补抽样技术的误差,用足够多的样本数来保证市场数据的真实可靠,但委托方对样本量增多而带来的调研成本的提高也非常敏感,调研的经济约束要求我们用最少的样本数来达到最大的抽样精确度。一、影响样本量的要紧因素在市场调研实践中,样本量是关系到调研精确度与市场研究公司效益的一项重要指标。确定样本量是抽样方案的一个重要内容,也是实施抽样前务必解决的一个问题0样本量过大,会使调查费用显著增加,人力及管理费用加大,从而也难以表达抽样调查的优越性;样本量过小,又会使样本对总体的代表性降低,增大抽样误差。因此,解决抽样设计中的样本量问题至关重要。从统计学的角度来看,影响样本量的因素要紧包含置信度与同意误差。简言之
3、,置信度是对抽样估计可靠性的度量,同意误差是指事先要求与定的置信概率相对应的抽样误差g8的最大范围,它是对抽样估计的精确度提出的要求。另一方面,就具体的调研项目而言,项目的总预算费用又构成了样本量的一个上限。容量过大就会突破预算约束,导致超支,这是受托方风险。设经费总额为c,费用函数能够表示为C=C0+阀Cl其中,。为固定费用,与样本量无关;为平均每一样本单位需要的调查经费。由此CYOH三解出的样本量,能够作为经费约束的一个基本条件。二、简单随机抽样样本量的测度方法1 .基本公式在简单随机抽样的条件下,我们所使用的确定调查样本量的公式为:其中:n代表所需要样本量;Z表示置信水平下的Z统计量,如
4、95%置信水平的Z统计量为1.96,99%的Z为2.68;S代表总体的标准差;d代表置信区间的1/2,在实际应用中就是容许误差,或者者调查误差。关于比例型变量,确定样本量的公式为:d其中:n表示样本量;Z表示置信水平下的Z统计量,如95%置信水平的Z统计量为1.96,99%的为2.68;P表示目标总体的比例期望值;d表示置信区间的半宽,即调查误差。2 .公式的应用一些参数是我们能够事先确定的:Z值取决于置信水平,通常我们能够考虑=95%的置信水平,那么Z=1.96;或者者取=99%,Z=268.然后能够确定容许误差d(或者者说精度),即我们能够根据实际情况指定置信区间的半宽度d。因此,公式应用
5、的关键是如何确定总体的标准差So假如我们能够估计出总体的方差(标准差),那么我们能够根据公式计算出样本量。比如,要熟悉某城市的居民收入,假定我们明白该市居民收入的标准差为1000,要求的调查误差不超过100元,则在95%的置信水平下,所需的样本量为n=!%7,=384.16W385100,即需要调查的样本量为385个。3 .最大样本量的讨论以上公式只是理论上的,在实际调查中确定合理的样本量,务必考虑多方面的因素。首先,由于人们通常缺乏对标准差的感性认识,因此对标准差的估计往往是比较困难的。总体的标准差是123,还是765?假如没有一点对样本的先验知识,那么对标准差的估计是不可能的。好在我们通常
6、能对变量的平均值进行估计,如我们通过历史资料估计该地区目前的年人均收入大致为10,000元,那么根据统计学知识,我们引入变异系数的概念:变异系数V=标准差S/平均值X=1因此,我们明白人均收入的标准差应该小于平均值,就是说标准差应该在IoOooF列。当然,这关于我们确定样本量还不能起太大的作用。假如我们使用相对误差表述的精度,我们有/疗P-57其中P表示相对误差根据上述公式,我们能够计算在相对误差一定的情况下,所需的最大样本量。下列是在置信程度95%的水平下,在不一致相对误差下的最高样本量:相对误差1%2%3%4%5%10%20%样本量38416960442682401一五37385104通常
7、,变异系数为1的情况是很少见的,根据本人对市场研究中经常遇到的情况,变异系数多在50%下列,因此,实际所需要的样本量能够进一步缩小。关于比例型变量,在事先缺乏对比例的估计时,我们能够使用最保守的估计法,即p=0.5,下列是比例P在不一致绝对误差程度下,所需的最大样本量(95%置信水平):P的绝对误差0.010.020.030.040.050.10所需最大样本量960424011067601385964 .实际调查样本量的确定原则尽管我们根据公式能够从理论上确定样本量的上限,但是由于实际工作的经费与时间限制,使用最大样本量的可能性很小。而且,实际研究的情况通常要复杂得多,一项研究往往要考虑多个目
8、标,即要求对多个指标的误差进行操纵,而不是简单地考虑一个指标。因此我们在实际的市场研究中,务必综合考虑,使用多种方式来确定样本量。(1)调查的要紧目标一个现实的市场调查往往有多个目标,关于一些目标单一的调查,调查的样本量往往能够很少,比如100个,甚至50个就足够了。而关于具有多个目标的研究,务必考虑这些目标中变异程度最大,要求精度最高的目标。(2)分类比较的程度分类是市场研究中一个最基本的方法,研究者往往是通过分类来发现细分市场,确定产品的市场定位等。假定对同一变量(研窕目标),在一定精度与置信程度下,只要100个样本量就足够了,假如我们仅仅希望熟悉不一致性别的消费者市场,则确定样本量时只需
9、要考虑两类消费者的样本量,这样调查的总样本量可能需要200个以上,假如希望熟悉不致年龄层的消费者,则可能要将消费者分为多类,如分为:20岁下列,20-35,35-50,50岁以上等四类,这样的样本量需要400个以上。也就是说,确定样本量时务必考虑到每一类别的样本量。(3)调查区域的大小根据常识,调查区域越大,所需要的样本量可能越大,由于大区域内的样本变异程度通常较难掌握。此外,在实际研究中,我们还往往需要对大区域进行进一步分类,以寻求更加准确的市场细分。比如,对柯达胶卷进行的调研在北京的取样明显应高于太原。三、山西联通市场调研的抽样设计分配表山西联通是中国联合通信集团公司的全资子公司,负责经营
10、山西省各地市的综合电信业务。该公司十分注重市场调查,对市场调研的精度与深度都有一定的要求。2003年6月实施的山西省联通用户综合业务调研中,样本的设计具有一定的科学性。本文给出了本次调查计划中全省范围市场调查的样本配置方案,以资参阅。设p为本次调查总体的任一比例值,力为其估计值,要求P(p-p)=I-Qf则样本大小n能够计算如下:误差d置信度l-样本大小n误差d置信度1-样本大小n0.070.90一三810670.9511720.960.030.97一三080.060.90一八80.98一五090.99一八4224010.953850.9526370.964220.960.050.974710
11、.020.9729460.985430.9833930.996630.9941450.9596040.956010.96105480.966600.040.977360.010.97117730.988490.98一三5730.9910360.9916577假设在95%的概率保证下,最大误差不超过2%,可取的一个样本方案是2401。我们考虑到山西省各地市人口数量的差异,使用比例配置法把全部样本依照比例分摊到各个地市。结果如下表:地区人口(万人)人口比例样本数n修正样本数m太原市29300000.09491416227227大同市26900000.087一三962209209阳泉市1220000
12、0.0395205794一三8长治市30600000.09912536238238晋城市20600000.06673145160160朔州市一三200000.04275996102一三8忻州市28200000.09三5083219219离石市32800000.10625202255255晋中市29600000.09588597230230临汾市38400000.12439261298298运城市46900000.一五19274436436430870000124012476我们注意到,阳泉市与朔州市的样本均在一三8下列,也就是说,这两个地市的抽样精度还达不到90%的置信度,而最大误差则超过了7
13、%。因此,我们对这两个地市的样本数量进行修正,均提高到一三8,以满足各个地市调查数据能够独立的要求,如今,两个地市的抽样概率置信度都达到了90%,最大误差操纵在7%下列。调整以后的样本列在表的最右边一列。这时,样本总数达到了2476个。注记,1 .通过对方差的估计,使用公式计算所需样本量,要紧使用两步抽样,即在调查前先抽取少量的样本,得到标准差S的估计,然后代入公式中,得到下一步抽样所需样本量n;假如有往常类似调查的数据,能够使用往常调查的方差作为总体方差的估计。2 .根据经验,确定样本量的要紧方法有:假如往常有人做过类似的研究,初学者能够参照前人的样本。假如是大型城市、省市一级的地区性研究,样本数在500.1000之间可能比较适合;而关于中小城市,样本量在200-300之间可能比较适合;假如是多省市或者者全国性的研究,则样本量可能在IOoo-3000之间比较适合。3 .作为一个常识(要紧是为了显著性检验),要进行分组研究的每组样本量应该很多于30个。4 .通过调研设计所作的研究,能够使用较小的样本量。如产品试用(留置)调查,在经费有限的情况下,能够将每组的样本量降低至一五个左右,最好每组在30以上。此外,我们在多次的实际研究中发现,每组样本超过50个可能是一种资源浪费