《石大医学统计学讲义02集中趋势.docx》由会员分享,可在线阅读,更多相关《石大医学统计学讲义02集中趋势.docx(7页珍藏版)》请在第壹文秘上搜索。
1、第二讲集中趋势举例设有A、B两名新战士,他们的射击技术可用下面的分布来表示:战士A战士B击中环数8910击中环数8910对应概率0.30.10.6对应概率0.20.50.3问哪一个战士射击技术较好?1、频数分布表1人频数表的编制相同观察结果出现的次数称为频数。将所有观察结果的频数按一定顺序排列在,起便是频数表(frequencytable)。步骤:找出最大和最小值,计算极差R=Xmax-Xmin根据斯梯阶公式确定组距1+3.322logn扫描样本值,划记后获得频数2人频数表的用建大样本数据(不限于计量资料)常用的表达方式。便于观察数据的分布类型。便于发现资料中远离群体的某些特大或特小的可疑值,
2、必要时经检验后舍去。当样本含量足够大时,各组段的分布频率作为分布概率的估计值。例7.我国某地农村1995年已婚育龄妇女现有子女数的分布子女数(1)妇女数f(2)频率()(3)累计频数(4)累计频率()(5)0137519.45137519.4512519117.303892226.7523042620.916934847.6532856019.629790867.2842171914.9211962782.205136959.4113332291.61672554.9814057796.60732682.2514384598.8581510.1014499699.6493730.2614536
3、999.892101560.11145525100.00合计145525100.002、集中位置的描述平均数(average)是统计中最广泛、最重要的一个指标体系。用来描述一组变量的集中趋势、中心位置或平均水平,常作为一组资料的代表值,使资料产生简明概括的印象,又便于组间的比较。常用平均数有均数、几何均数和中位数。(一)、均数(mean)的计算,二.+怎=一直接法例1、10名7岁男童体重(kg)分别为17.3,18.0,19.4,20.6,21.2,21.8,22.5,23.2,24.0,25.5.求平均体重。元=(17.3+18.0+19.4+20.6+21.221.8+22.5+23.22
4、4.0+25.5)/10=21.35(kg)频数表法:_fa、+力演+,+_,x7A例2:某地随机检查了140名成年男性红细胞数(102l)4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.935.044.405.274.635.505.244.974.714.444.945.054.784.524.635.515.244.984.334.834.565.444.794.914.264.384.874.995.604.464.955.074.805.304.654.774.505.375.495.
5、224.585.074.814.543.824.014.894.625.124.854.595.084.824.935.054.404.145.014.375.244.604.714.824.945.054.794.524.644.374.874.604.724.835.334.684.804.154.654.764.884.613.974.084.584.314.054.165.045.154.504.624.734.474.584.704.814.554.284.784.514.634.364.484.595.095.205.325.054.414.524.644.754.494.224.
6、715.214.944.685.174.915.024.76红细胞数(IoE7L)(1)频数f(2)组中值X(3)Fx(4)=(2)*(3)3.80-23.907.84.00-64.1024.64.20-114.3047.34.40-254.50112.54.60-324.70150.44.80-274.90132.35.00-175.1086.75.20-135.3068.95.40-45.5022.05.60-25.7011.45.80-15.905.9合计140(Ef)669.8(EfX)7-+X2+4+Zf,fx=4.78(1012L)均数的两个重要特征:各离均差的总和等于零(-)=o证明:Z(巧一X)=ZXi-X=ZXi-ZXi=0各离均差的平方和小于各观察值X与任何数a之差的平方Z(X-又)25=50+-(36125%-39)=69.12(gm3)67Z5=125+(36175%-233)=145.97(Mg/疝)25电5=250+(36195%-341)=258.12(g/nv,)60=100+-(361/2-170)=104.17(n3)63中位数和百分位数的应用:1 .用于描述偏态分布资料的集中位置。反映位次居中的观察值的水平。2 .百分位数是用于描述样本或总体观察值序列在某百分位置水平,最常用的百分位数是中位数。3 .百分位数常用来确定医学参考值范围。