《数据分析初步-复习讲义.docx》由会员分享,可在线阅读,更多相关《数据分析初步-复习讲义.docx(10页珍藏版)》请在第壹文秘上搜索。
1、第三章数据分析初步工程一知识概要1.平均数、中位数、众数的概念及举例一般地,对于n个数xl,x2,,Xn,我们把,叫做这n个数的算术平均数,简称平均数。一般地,n个数据按大小顺序排列,处土的一个数据(或)叫做这组数据的中位数。一组数据中出现次数的那个数据叫做这组数据的众数。2.平均数、中位数、众数的特征(1)平均数、中位数、众数都是表示一组数据“平均水平”的特征数。(2)平均数能充分利用数据提供的信息,在生活中较为常用,但它容易受极端数字的影响,且计算较繁。(3)中位数的计算简单,受极端数字影响较小,但不能充分利用所有数字的信息。当一组数据中个别数据变动较大时,可选择中位数来表示这组数据的“集
2、中趋势”。(4)众数的可靠性较差,它不受极端数据的影响,求法简便。当一组数据中某些数据屡次重复出现时,众数是我们关心的一种统计量。3.加权平均数例1:统计一名射击运发动在某次训练中15次射击的中靶环数,获得如下数据:6,7,8,7,7,8,10,9,8,8,9,9,8,10,9,求这次训练中该运发动射击的平均成绩。4、方差与标准差在一组数据中,各数据与它们平均数的差的平方的平均数(即“先平均,再求差,然后平方,最后再平均”)得到的数叫方差,公式是标准差公式是工程二例题精讲【例1.为了了解学生参加体育活动的情况,学校对学生进行随机抽样调查,其中一个问题是“你平均每天参加体育活动的时间是多少?”,
3、共有4个选项:A.1.5小时以上B.11.5小时C.0.51小时D.0.5小时以下图1、2是根据调查结果绘制的两幅不完整的统计图,请你根据统计图提供的信息,解答以下问题:(1)本次一共调查了多少名学生?(2)在图1中将选项B的局部补充完整;(3)假设该校有3000名学生,你估计全校可能有多少名学生平均每天参加体育活动的时间在0.5小时以下.【例2】:某商场一天中售出李宁牌运动鞋16双,其中各种尺码的鞋销售如下表所示鞋的尺码(cm)23.52424.52526销售量(双)13462这组数据的众数和中位数各是多少?【例3】.我市局部学生参加了2004年全国初中数学竞赛决赛,并取得优异成绩.竞赛成绩
4、分数都是整数,试题总分值为140分,参赛学生的成绩分数分布情况如下:请根引分数段0-1920-3940-59607980-99100-119120-140人数0376895563212昌以上信息蟀答以下问题:(1)全市共有多少人参加本次数学竞赛决赛?最低分和最高分在什么分数范围?(2)经竞赛组委会评定,竞赛成绩在60分以上(含60分)的考生均可获得不同等级的奖励,求我市参加本次竞赛决赛考生的获奖比例;(3)决赛成绩分数的中位数落在哪个分数段内?(4)上表还提供了其他信息,例如:“没获奖的人数为105人”等等.请你再写出两条此表提供的信息.【例4】:某班甲小组有6人,数学平均成绩为80分,乙小组
5、有8人,数学平均成绩为75分,这两个小组的平均成绩是多少?【例5】:求数据1,3,8,4,9,7,5的中位数。【例6】:某次数学测验总分值100分,某班的平均成绩为75分,方差为10,假设把每位同学的成绩按总分值120分进行换算,那么换算后的平均成绩与方差分别为()和()。工程三冲刺必练一、判断题1、假设一组数据的众数是5,那么这组数据中出现次数最多的是5。()2、一组数据的平均数、众数、中位数有可能相同。()3、一组数据的平均数一定大于其中的每一个数据。()4、一组数据中处于最中间位置的一个数据,叫做这组数据的中位数。()5、某产品的销量占某城市同类产品销量的40%,由此可判断该产品在国内同
6、类产品的销量占40%.()二、填空题1、某班45名学生中,14岁的15人,15岁的18人,16岁的11人,17岁的1人,那么这个班学生的平均年龄是岁(保存两个有效数字)。2、一组数据1、3、6、a、b的平均数是4,那么a与b的和是。3、某公司招聘推销人员,小亮的成绩是:形象84分,语言能力78分,应变能力88分,这三种成绩平均分是,假设三种成绩依次按3:4:3的比例来计算,那么这三种测试的平均分是O4、样本数据10、10、X、8的众数与平均数相同,那么这组数据的中位数是o5、某次测验的最高分、最低分、平均分、中位数,同学甲要知道自己的成绩,属于班级中较高的一半还是较低的一半,应利用上述数据中的
7、o6、如果样本方差=(x)-2)2U-2)2U-2)2+U-2)2,那么这个样本的平均数为,样本容量为.三、选择题1、假设一组数据x】、X2、X3、X.X5的平均数是a,那么另一组数据xi、x2+lx3+2xt+3Xs+4的平均数是()(八)a(B)a+2(C)a+5/2(D)a+102、当五个整数从小到大排列,其中位数为4,假设这组数中的惟一众数为6,那么这5个整数可能的最大和为()(A) 21(B) 22(C) 23(D) 243、在共有15人参加的“讲诚信”演讲比赛中,参赛选手的成绩各不相同,因此选手要想知道自己是否进入前8名,只需要了解自己的成绩以及全部成绩的()(八)平均数(B)中位
8、数(C)众数(D)以上答案都不正确4、某校在预防“非典型肺炎”过程中,坚持每日检查体温,下表是该校八年级四班同学一天的体温数据统计表,那么该班40名学生体温的中位数是()体温(t)36.036.136.236.336.436.536.636.736.836.937.0人数02057563831(八)36.8C(B)36.5C(C)36.6(D)36.45、A、B、C、D、E五名射击运发动在一次比赛中的平均成绩是80环,而A、B、C三人的平均成绩是78环,那么以下说法中一定正确的选项是()A.D、E的成绩比其他三人好B.B、E两人的平均成绩是83环C.最高分得主不是A、B、CD.D、E中至少有1
9、人的成绩不少于83环。6、如果a、b、C的中位数与众数都是5,平均数是4,那么a可能是()A. 2B. 3C. 4D. 67、由小到大排列一组数据a.,a2,a,、&、a5,其中每个数据都小于0,那么对于样木a1,a2,-a:,.-a,-a50的中位数可表示为()8、以下说法中正确的有()(1)描述一组数据的平均数只有一个;(2)描述一组数据的中位数只有一个;(3)描述一组数据的众数只有一个;(4)描述一组数据的平均数,中位数,众数都一定是这组数据里的数;(5) 一组数据中的一个数大小发生了变化,一定会影响这组数据的平均数,众数,中位数。A.1个B.2个C.3个D.4个9、一城市准备选购一千株
10、高度大约为2m的某种风景树来进行街道绿化,有四个苗圃生产基地投标(单株树的价格都一样).采购小组从四个苗圃中都任意抽查了20株树苗的高度,得到的数据如下:树苗平均高度(单位:m)标准差甲苗圃1.80.2乙苗圃1.80.6丙苗圃2.00.6丁苗圃2.00.2请你帮采购小组出谋划策,应选购().A.甲苗圃的树苗B.乙苗圃的树苗C.丙苗圃的树苗D.丁苗圃的树苗10、衡量样本和总体的波动大小的特征数是().A.平均数B.方差C.众数D.中位数四、解答题1 .两组数,2Xn和九丫江以;它们的平均数分别是I和亍。分别求以下各组新数据的平均数:(1) 5x,5x2,5x11;(2) xiy,X2Y2,X11
11、-yn;(3) x,y,X2,yz,,Xny11o2 .某商厦在“十一长假期间”平均每天的营业额为20万元,由此推断10月份该商厦的总营业额约为20X30=620(万元)。根据你所学的数理统计知识,你认为这样的推断是否合理?为什么?(3)请估算该班此次考试的平均成绩。4.某中学为了了解全校的耗电情况,抽查了10天中每天的耗电量数据如下表(1)写出上表中数据的众数和平均数;(2)由上题获得的数据,估计该校一个月的耗电量按30天计算);(3)假设当地每度电的价格是0.5元,写出该校应付电费y(元)与天数X(X取正数,单位:天)之间的函数关系式。5、汶川地震牵动着全国亿万人民的心,某校为地震灾区开展
12、了“献出我们的爱”赈灾捐款活动。八年级(1)班50名同学积极参加,班长统计了全班捐款情况如下表,因不慎有两处被墨水污染,已无法看清。但知全班平均每人捐款38元,根据以上信息,请你求出捐款40元,50元的学生人数,并写出解答过程;搞献元101530405060人36H66、在某旅游景区上山的一条小路上,有一些断断续续的台阶,以下图是其中的甲、乙两段台阶的示意图(图中的数字表示每一级台阶的高度(单位:cm).并且数据15,16,16,14,14,15的方差S甲2=|,数35据11,15,18,17,10,19的方差S乙?=)o请你用所学过的有关统计的知识(平均数、中位数、方差和极差)答复以下问题:(1)两段台阶路有哪些相同点和不同点?哪段台阶路走起来更舒服?为什么?(3)为方便游客行走,需要重新整修上山的小路.对于这两段台阶路,在台阶数不变的情况下,请提出合理的整修建议.