《统计学期末总复习.ppt》由会员分享,可在线阅读,更多相关《统计学期末总复习.ppt(52页珍藏版)》请在第壹文秘上搜索。
1、统计学统计学第一章1.统计的含义、特点2.统计总体和总体单位3.标志与统计指标第二章调查对象和调查单位、报告单位统计调查的分类统计调查的分类按收集资料的组织形式按调查对象包括的范围统计调查的组织方式统计调查的组织方式 统计报表 普查 重点调查 典型调查 抽样调查第三章1.统计分组统计分组2.统计分组的作用统计分组的作用 划分现象的不同类型 说明现象的内部结构 揭示现象之间的依存关系第三章3、分组标志的选择分组标志的选择4、统计分组的方法、统计分组的方法 品质标志分组品质标志分组 数量标志分组数量标志分组 3.某行业管理局所属32家企业2007年的产品销售收入数据(单位:万元)如下: 152 1
2、24 129 116 100 103 92 95 105 119 114 115 87 103 118 142 117 108 105 110 107 137 120 136 98 88 123 115 119 138 112 146 根据上面的数据进行适当分组,编制频数分布表。 4.按组距方式分组: 第一组5565;第二组6575; 第三组7585;第四组85以上,则数据() A. 65在第一组 B. 75在第二组 C. 75在第三组 D. 85在第三组 5.频数分布表中各组频率的总和应该( ) A小于1 B. 等于1 C. 大于1 D. 不等于1第四章总量指标和相对指标相对指标 总量指标的
3、概念和分类 六种常用的相对指标结构相对指标比例相对指标比较相对指标强度相对指标动态相对指标计划完成程度相对指标平均指标和变异指标加权算术平均数调和平均数众数中位数方差离散系数异众比例均值加权算术平均数设分组后的各组的标志值为: x1 ,x2 , ,xk 相应的频数为: f1 , f2, ,fk则,加权算术平均数的计算公式为:kiikiiikkkffxffffxfxfxx11212211均值调和平均数设分组后的各组的标志值为: x1 ,x2 , ,xk 各组相应的标志总量为: m1 , m2, ,mk则,调和算术平均数的计算公式为:kiiikiikkkmxmmxmxmxmmmmH11221121
4、众数、中位数众数:众数:出现次数最多的变量值;中位数:中位数:数据排序后处于中间位置上的值;方差反映了各变量值与均值的平均差异;反映了各变量值与均值的平均差异;计算公式:计算公式:nxxnii122)(kiikiiiffxx1122)(未分组数据:组距分组数据: (1)计算乙车间200名工人的平均产量和产量的标准差; (2)分别计算甲、乙车间工人产量的变异系数(离散系数),说明哪个车间工人的平均产量具有较大的代表性。按产量分组(件)按产量分组(件)工人数工人数60-8060-80303080-10080-100505010-12010-1208080120-140120-1403030140-
5、160140-16010106.某厂甲车间160名工人生产某产品的平均产量为100件,产量的标准差为21.89件。又知乙车间200名工人产量的分组资料如下:第五章时间数列的水平分析和速度分析时间数列的水平分析和速度分析发展水平发展水平 平均发展水平平均发展水平 增长量增长量(逐期增长量,累计增长量,平均增长量)(逐期增长量,累计增长量,平均增长量) 发展速度发展速度(定基发展速度,环比发展速度,平均发展速度)(定基发展速度,环比发展速度,平均发展速度) 增长速度增长速度(定基增长速度,环比增长速度,平均增长速(定基增长速度,环比增长速度,平均增长速度)度)增长增长1%的绝对值的绝对值绝对数绝对
6、数相对数相对数平均数-1第五章 时间序列计算:()第二季度平均月产量;计算:()第二季度平均月产量; ()第二季度平均人数;()第二季度平均人数; ( 3 3 )二季度每人平均产量)二季度每人平均产量三月三月四月四月五月五月六月六月月末工人数(人)月末工人数(人)2000200022002200总产值总产值11.012.614.616.3已知下列资料第六章统计指数的概念和分类统计指数的概念和分类指数化因素和同度量因素指数化因素和同度量因素加权综合指数、平均数指数加权综合指数、平均数指数 拉氏指数(数量)拉氏指数(数量) 帕氏指数(质量)帕氏指数(质量)指数体系与因素分析指数体系与因素分析常用价
7、格指数常用价格指数第七章抽样的组织方式抽样的组织方式 简单随机抽样 类型抽样类型抽样 等距抽样 整群抽样整群抽样 多阶段抽样抽样误差抽样误差 抽样平均误差抽样平均误差 抽样极限误差区分第七章单一总体均值的区间估计(方差已知或大样本)单一总体均值的区间估计(方差未知且小样本)单一总体比例的区间估计总体均值区间估计时样本容量的确定总体比例区间估计时样本容量的确定单一总体均值的区间估计(方差已知或大样本)单一总体均值的区间估计(方差已知或大样本)方差已知或大样本方差已知或大样本1.假设:已知总体标准差;总体正态分布;如果不是正态, 可被正态分布逼近 (样本容量 n 30)2.置信区间:nZx.2/单
8、一总体均值的区间估计(方差未知且小样本)单一总体均值的区间估计(方差未知且小样本)方差未知且小样本方差未知且小样本1. 假设 : 总体标准差未知; 总体服从正态分布; 样本容量 n 30;2. 置信区间:nstxn.1,2/单一总体比例的区间估计单一总体比例的区间估计1.假设:总体服从二项分布; 可以用正态分布近似估计,即n p 5 且 n (1 - p) 5;3.置信区间:2.引理:) 1 , 0()1 (/ )(000NnppppnppZp)1 (.002/0样本容量的确定样本容量的确定估计总体均值时:估计总体比例时:22/22znE2/221znE8. 某高中随机抽查了10个高二的男学生
9、,平均身高170厘米,标准差12厘米。 (1)用矩估计法估计该高中高二男生的平均身高; (2)若该高中高二男生的身高服从正态分布,问该高中高二男生平均身高的所在范围(=0.05)。9.某工业区有300家企业,用简单随机重复抽样的方法抽出50家作为样本,调查其年利润额,资料如下: 年利润额(万元):1200 1300 1500 1600 企业数(家): 5 15 20 10 要求: (1)用矩估计法估计该工业区企业的平均年利润额及其方差; (2)以95%的可靠性估计该工业区企业的平均年利润额和利润总额的区间。 10.某地区为了解该地区贫困家庭的生活情况,随机抽取200户家庭, 其中20户在国家规
10、定的生活贫困线以下,请问在95%的置信水平下,该地区有百分之多少的家庭在国家规定的生活贫困线以下?11. 一项研究计划估计在一片森林中平均每年一棵树长高了多少,研究人员准备用95的置信水平,并希望估计出的均值的误差不超过0.5cm。以前的研究显示样本的标准差为2cm。请问,这项研究的样本容量需要多大才能满足要求? 12.在简单重复随机抽样时,当允许误差缩小一半,则n 要( ) A.缩小4倍 B. 增大4倍 C. 增大2倍 D. 缩小2倍 13.在其它条件不变的情况下( ) A.总体方差越大,所需的样本容量越少 B.总体方差越大,所需的样本容量越多 C. 允许的误差越小,所需的样本容量越少 D.
11、 允许的误差越大,所需的样本容量越多 14. 在抽样设计中,最好的方案是( ) A. 抽样误差最小的方案 B. 抽样单位最小的方案 C. 调查费用最少的方案 D. 在一定误差要求下费用最小的方案 单一总体均值的假设检验(方差已知或大样本)单一总体均值的假设检验(方差未知且小样本)单一总体比例的假设检验两个总体均值差的假设检验两个总体比例之差的假设检验总体均值的假设检验:总体均值的假设检验:(1)方差已知或大样本:(2)方差未知且小样本:总体比例的假设检验:总体比例的假设检验:(1)单一总体:nxZ/0nsxt/0nppppZ)1 (/ )(00015. 已知在正常生产的情况下某种汽车零件的重量
12、(克)服从正态分布 ,在某日生产的零件中抽取10 件,测得重量如下: 55.1 53.8 54.2 52.1 54.2 55.0 55.8 55.1 55.3 54 如果标准差不变,该日生产的零件的平均重量是否有显著差异(取=0.05 )? )75. 0 ,54(N16. 正常人的脉搏平均为72次/分,现测得10例慢性四乙基铅中毒患者的脉搏(次/分)如下: 54 67 68 78 70 66 67 70 65 69 问四乙基铅中毒患者和正常人的脉搏有无显著差异?(假定中毒患者脉搏服从正态分布,=0.05)17. 某企业生产的某种型号电池,长期统计资料表明其平均寿命为1000(小时)。现从该厂生
13、产的一批产品中,随机抽取20只,测得其平均寿命为960(小时)的样本标准差为90(小时)。根据这个数字能否断定新生产的这批电池为合格品?(=0.05) 18. 一家制药公司声称,某地区大概有22%的儿童缺钙,一个研究组织对400名该地区的儿童进行了研究,发现其中有80名儿童缺钙。 根据该研究组织的数据,能否认为这家制药公司的论断是正确的? ( =0.05)方差分析的表现形式方差分析的表现形式方差分析的本质方差分析的本质方差分析的基本思想、原理、过程方差分析的基本思想、原理、过程看软件结果:第八章相关分析相关分析 一元线性回归分析一元线性回归分析相关分析Pearson相关系数相关系数计算公式:2
14、2)(.)()(yyxxyyxxriiii相关系数的性质相关系数的性质1. -1 r 1;2. 如果r0,则两个变量正相关;如果r=0,则两个变量无线性关系;3. |r|0.95 存在显著性相关;|r|0.8 高度相关;0.5 |r|0.8 中度相关;0.3 |r|0.5 低度相关;|r|0.3 关系极弱,认为不相关;相关系数的检验(1 1)提出假设:)提出假设:(2 2)计算检验的统计量:)计算检验的统计量: (3 3)确定显著性水平)确定显著性水平 ,并作出决策:,并作出决策: 若若 ,拒绝原假设;若,拒绝原假设;若 ,不拒绝原假设。,不拒绝原假设。2)-(122ntrnrt0:; 0:1
15、0HH2/ tt2/ tt一元线性回归分析 寻找一条直线,使得所有点到该直线的垂直距离的平方和最小。xbybxxnyxxynb10221,)(19. 产品产量与单位成本的相关系数是0. 85,销量与利润的相关系数是0.75,产量与利润的相关系数是0.80,因此( ) A. 产量与利润的相关程度最高 B. 销量与利润的相关程度最高 C. 产量与单位成本的相关程度最高 D. 看不出哪对变量的相关程度高20. 在一元线性回归方程中,若回归系数b=0,则表示( ) A. y对x的影响是显著的 B. y对x的影响是不显著的 C. x对y的影响是显著的 D. x对y的影响是不显著的21. 在其他条件不变的
16、情况下,某种商品的需求量(y)与该商品的价格(x)有关。现对给定时期内的价格与需求量进行观察,得到如下所示的一组数据。 价格x(元) 10 6 8 9 12 需求量y(件) 60 72 70 58 55 (1)计算价格与需求量之间的Pearson相关系数,并说明相关方向和程度; (2)拟合需求量与价格的一元线性回归方程。求解过程xy106011393672399812787011749795800525012553986424合计20228-6163, 9yxxxiyyi2)(xxi2)(yyi)(yyxxii903. 02282061)(.)()(22yyxxyyxxriiii相关系数的检验(1 1)提出假设:)提出假设:(2 2)计算检验的统计量:)计算检验的统计量:(3 3)取)取 ,查表得:,查表得: 由由 ,拒绝原假设,即认为总体上价格与需求量,拒绝原假设,即认为总体上价格与需求量之间相关关系显著。之间相关关系显著。255.40.903-130.903-1222rnrt0:; 0:10HH/2tt05. 0182. 33,2/t求解过程xyxyx210606001006724