《第五章统计与概率(知识梳理热考题型)(解析版).docx》由会员分享,可在线阅读,更多相关《第五章统计与概率(知识梳理热考题型)(解析版).docx(33页珍藏版)》请在第壹文秘上搜索。
1、第五章统计与概率单元复习【知识梳理】一、普查与抽样调查普查定义:一般地,对总体中每个个体都进行考察的方法称为普查(也称为全面调查).优点:普查能够了解总体中每个个体的情况,从而能准确地掌握总体的特征.适用条件:在总体包含的个体总数不大,或有特殊需要的情况下,可以采用普查的方法.(2)抽样调查定义:只抽取挂本进行考察的方法称为抽样调查.适用条件:普查的方法有时会因为各种原因而无法实施,例如成本太高、时间上不容许、考察方法具有破坏性等,此时就采用抽样调查.二、简单随机抽样定义:一般地,简单随机抽样就是从总体中不加任何分组、划类、排队等完全随机地抽取个体.(2)特点:总体中的每一个个体都有相等的机会
2、被抽到.适用范围:当总体中的个体之间差异程度较小和总体中个体数目较少时,通常采用这种方法.(4)常见的简单随机抽样方法有抽签法、随机数表法.抽签法的优缺点抽签法的优点是简单易行,缺点是当总体的容量韭蜜大时,操作起来就比较麻烦,而且如果抽取之前搅拌不均匀,可能导致抽取的样本不具有代表性.随机数表法用随机数表进行简单随机抽样的一般步骤为:(i)对总体进行编号.(ii)在随机数表中任意指定一个开始选取的位置.位置的确定可以随机确定,也可用其他方式随机确定.(迨)按照一定规则选取编号.例如,若编号是两位,规则可以是每次从左往右选取两个数字,也可以是每次只选取每一组的前两个数字,还可以是每次只选取下面一
3、行同一位置对应的两个数字,等等.规则一经确定,就不能更改.在选取过程中,遇到超过编号范围或已经选取了的数字,应该舍弃.(iv)按照得到的编号找出对应的个体.三、分层抽样定义:一般地,如果相对于要考察的问题来说,总体可以分成有明显差别的、互不重叠的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简称为分层抽样).(2)作用:通过分层抽样所得到的样本,一般更具有代表性,可以更准确地反映总体的特征.四、最值、平均数、中位数、百分位数、众数最值一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况.平均数定义:如果给定的一组数是XI,X2,
4、,则这组数的平均数为X=%i+jq+G这一n公式在数学中常简记为X=;刈性质:一般地,如果Xi,X2,,%的平均数为X,且,b为常数,则x+6,ax+bt,ax,b的平均数为axb.(3)中位数、百分位数中位数:一般地,如果一组数有奇数个数,且按照从小到大排列后为修,X2,,x2w+,则称迎L为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为为,X2,,X2z,则称黜为这组数的中位数.2百分位数:设一组数按照从小到大排列后为汨,X2,,计算i=叩的值,如果】不是整数,设io为大于i的最小整数,取血为p%分位数;如果,是整数,取句聚为P%分位数.特别地,规定:O分位数是曲(即最小值)
5、,100%分位数是当(即最大值).(4)众数:一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数.五、极差、方差与标准差(1)极差:一组数的极差指的是这组数的最大值减去最小值所得的差.极差反映了一组数的变化范围.(2)方差定义:如果修,X2,,刈的平均数为;,则方差可用求和符号表示为性质:如果,b为常数,则QXI+b,OX2+6,,ax”+另的方差为次。(3)标准差S=/七(/一亍)2定义:方差的算术平方根S表示,即样本数据XrX2,,X”的标准差为NL-性质:如果a,6为常数,则Orl+b,ax+bt,ax+6的标准差为同s.作用:如果一组数中,各数据值都
6、相等,则标准差为0,表明数据没有波动,数据没有离散性;若各数的值与平均数的差的绝对值较大,则标准差也较大,表明数据的波动幅度也较大,数据的离散程度较高,因此标准差(或方差)描述了数据相对于平均数的离散程度.六、柱形图、折线图、扇形图和茎叶图柱形图柱形图(也称为条形图)可以形象地比较各种数据之间的数量关系.特点:柱形图(也称为条形图)中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,柱形图中每一矩形都是笠宽的.折线图一般地,如果数据是随时间变化的,想了解数据的变化情况,可将数据用折线图来表示.扇形图扇形图可以形象地表示出各部分数据在全部数据中所占的比例情况.扇形图中,每
7、一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.(4)茎叶图一般来说,茎叶图中,所有的茎都竖直排列,而叶沿水平方向排列.茎叶图也可以只表示一组数.“叶”是从“茎”的旁边生长出来的数.茎叶图通常用来记录两位数的数据,把两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上往下排列.将一组数整理成茎叶图后,如果每一行的数都是按从大到小(或从小到大)顺序排列,则从中可以方便地看出这组数的最值、中位数等数字特征.七、频数分布直方图与频率分布直方图频数与频率频数:在一组数据中,数据出现的次数称为频数,某个区间内的数据的个数称为区间对应的频数.频率:在一组数
8、据中,数据的频数与这组数据总个数的比称为频率,区间对应的频数与这组数据总个数的比称为区间对应的频率.(2)频数、频率分布直方图及其折线图频率分布直方图制作的方法步骤找出最值,计算极差频数分布直方图与频率分布直方图的区别频数分布直方图的纵坐标是频数,每一组数对应的矩形高度与频数成正比;频率分布直方图的纵坐标是普善,每一组数对应的矩形高度与频率成正比,而且每个矩形的面积等于这一组数对组距应的频率.频数分布折线图和频率分布折线图的制作方法把每个矩形上面一边的中点用线段连接起来.为了方便看图,折线图都画成与横轴相交,所以折线图与横轴的左右两个交点是没有实际意义的.八、用样本估计总体用样本的分布估计总体
9、的分布(1)一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.(2)在容许一定误差存在的前提下,可以用挂本的数字特征去估计总体的数字特征.(3)分层抽样的平均数、方差假设第一层有2个数,分别为,X2,,Xm,平均数为X,方差为$2;第二层有个数,分别为,刈,平均数为八方差为四如果记样本均值为m样本方差为ZAm+n一t)11/=加卜2+(X4)2+俨+(y4)2=1Cms2+nt2)+Cxy)2m+nm+n九、概率(1)必然现象与随机现象一定条件下,发生的结果事先不能确定的现象
10、就是随机现象.发生的结果事先能够确定的现象就是必然现象.(2)样本点和样本空间随机试验把在相同条件下,对随机现象所进行的观察或实验称为随机试验W.样本点和样本空间把随机试验中每一种可能出现的结果,都称为样本点,把由所有样本点组成的集合称为样本空间.(3)随机事件、必然事件、不可能事件随机事件:如果随机试验的样本空间为。,则随机事件4是。的一个非空真子集.而且,若试验的结果是力中的元素,则称4发生;否则,称才不发生.必然事件:任何一次随机试验的结果,一定是样本空间。中的元素,因此可以认为每次试验中。一定发生,从而称0为必然事件;不可能事件:因为空集。不包含任何样本点,因此可以认为每次试验中。一定
11、不发生,从而称。为不可能事件W.事件的表示与基本事件(i)不可能事件、随机事件、必然事件都可简称为事件,通常用大写英文字母48,C,来表示.(ii)基本事件:只含有一个样本点的事件称为基本事件W.(4)随机事件发生的概率事件/发生的概率通常用P(力)表示.我们将不可能事件。发生的概率规定为0,将必然事件。发生的概率规定为L即尸(0)=。,P(Q)=IW.对于任意事件/来说,显然应该有尸(。)SP(N)SP(Q),即。W尸(N)WL十、事件之间的包含、相等、和与积(1)事件的包含与相等定义表示法图示包含关系一般地,如果事件/发生时,事件8一定发生,则称4包含于3(或5包含4)AQB(或B=A)相
12、等关系力且BQAA=B(2)事件的和与积定义表示法图示和由所有A中的样本点与B中的样本点组成的事件称为“与B的和(或并)力+8(或4UB)积由事件4B中的公共样本点组成的事件称为4与B的积(或交)丝(或48)3)十一、事件的互斥与对立及概率加法公式(1)事件的互斥与对立定义表示法图示互斥若事件力与3不能同时发生,则称4与8互斥力8=0(或4Pl8=0)nQo对立由样本空间。中所有不属壬事件X的样本点组成的事件称为A的对立事件事件4的对立事件记为4三如果3=4则称力与5相互对立.(2)互斥事件的概率加法公式互斥事件的概率加法公式:当N与5互斥(即N3=。)时,有R4+阴=PQ)+P/一般地,如果
13、小,Ai,4是两两互斥的事件,则PC+4)=PQI)+尸(42)+尸(4).尸+尸=1.十二、古典概型(1)古典概型一般地,如果随机试验的样本空间所包含的样本点个数是五限的(简称为有限性),而且可以认为每个只包含一个样本点的事件(即基本事件)发生的可能性大小都相笠(简称为等可能性),则称这样的随机试验为古典概率模型,简称为古典概型.(2)古典概型概率公式古典概型中,假设样本空间含有个样本点,如果事件C包含有m个样本点,则P(C)=NH十三、频率与概率用频率估计概率(1)在大量重复的试验过程中,一个事件发生的频率会很接近于这个事件发生的概率,而且试验的次数越多,频率与概率之间的差距很小的可能性越
14、大.(2)一般地,如果在次重复进行的试验中,事件/发生的频率为典,则当很大时,可以认为n事件A发生的概率P()的估计值为久.此时也有OWPa)WLn十四、相互独立事件的定义和性质(1)定义:一般地,当尸28)=PQ)P(B)时,就称事件4与8相互独立(简称独立).(2)性质:如果事件/与8相互独立,则/与8,A与B,4与5也相互独立.(3个事件相互独立“4,Ai94相互独立”的充要条件是“其中任意有限个事件同时发生的概率都等于它们各自发生的概率之积”.十五、独立事件的概率公式(1)若事件4B相互独立,则a4B)=PQ)XP(阴;(2)若事件4,42,,4相互独立,则尸(Zd十4,)=尸(NI)X尸(42)XX/(4).事件6的各种情形概率公式4,B同时发生P(AB)=P(八)P(B)A,8都不发生P(AB)=P(八)P(B)=-P(八)-P(B)=1-P(八)-P(B)+P(八)P(B)A,B至少有一个不发生1-P(AB)=1-P(八)P(B)A9B至少有一个发生1-P(AB)=1P(八)P(B)=P(八)+P(B)P(八)P(B)48恰好有一个发生P(AB+AB)=P(八)P(B)+P(八)P(B)=P(八)+P(B)2P(八)P(B)十六、统计与