雷静卫生统计学第二章定量资料的统计描述一.ppt

上传人:p** 文档编号:501085 上传时间:2023-09-27 格式:PPT 页数:23 大小:342.50KB
下载 相关 举报
雷静卫生统计学第二章定量资料的统计描述一.ppt_第1页
第1页 / 共23页
雷静卫生统计学第二章定量资料的统计描述一.ppt_第2页
第2页 / 共23页
雷静卫生统计学第二章定量资料的统计描述一.ppt_第3页
第3页 / 共23页
雷静卫生统计学第二章定量资料的统计描述一.ppt_第4页
第4页 / 共23页
雷静卫生统计学第二章定量资料的统计描述一.ppt_第5页
第5页 / 共23页
雷静卫生统计学第二章定量资料的统计描述一.ppt_第6页
第6页 / 共23页
雷静卫生统计学第二章定量资料的统计描述一.ppt_第7页
第7页 / 共23页
雷静卫生统计学第二章定量资料的统计描述一.ppt_第8页
第8页 / 共23页
雷静卫生统计学第二章定量资料的统计描述一.ppt_第9页
第9页 / 共23页
雷静卫生统计学第二章定量资料的统计描述一.ppt_第10页
第10页 / 共23页
亲,该文档总共23页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《雷静卫生统计学第二章定量资料的统计描述一.ppt》由会员分享,可在线阅读,更多相关《雷静卫生统计学第二章定量资料的统计描述一.ppt(23页珍藏版)》请在第壹文秘上搜索。

1、2023-9-272023-9-27 频率分布表:即对各变量值出现的频率频率分布表:即对各变量值出现的频率列表。用来描述定量资料的频数分布,列表。用来描述定量资料的频数分布,反映观察值的分布类型及分布特征。反映观察值的分布类型及分布特征。频率分布图频率分布图2023-9-27离散型定量变量的频率分布离散型定量变量的频率分布频率表的编制:直接清点各变量值及相同频率表的编制:直接清点各变量值及相同变量值出现的频率列表即可。变量值出现的频率列表即可。如:例如:例2-12-1,即可列成表,即可列成表2-12-1的形式的形式 其频率分布图如图其频率分布图如图2-12-1的形式的形式2023-9-27频数

2、表频数表 表表1.某地某地140名正常男子红细胞数的频数表名正常男子红细胞数的频数表红细胞数红细胞数(1012/L)划记划记 组中值组中值 频数频数 频率频率(%)3.80 3.90 2 1.4 4.00 4.10 6 4.3 4.20 4.30 11 7.9 .5.806.00 5.90 1 0.7连续型定量变量的频率分布连续型定量变量的频率分布2023-9-27 频率分布表的编制:频率分布表的编制:找最大值、最小值,求极差找最大值、最小值,求极差 按极差大小决定组段数、组段、组距按极差大小决定组段数、组段、组距 一般设一般设10-15个组段个组段 常用极差的常用极差的1/10取整作组距取整

3、作组距 要求:第一组段包括最小值要求:第一组段包括最小值 最后一个组段包括最大值最后一个组段包括最大值 每个组段的起点称每个组段的起点称下限下限(low limit)终点称终点称上限上限(upper limit)对于连续性资料,各组段从下限开始,对于连续性资料,各组段从下限开始,不包括本组段上限。不包括本组段上限。最末一个组段应同时写出其下限和上限。最末一个组段应同时写出其下限和上限。列表划记,求频数(列表划记,求频数(f)例:某地例:某地4040例中年健康男子血清总胆固醇值例中年健康男子血清总胆固醇值(mmol/Lmmol/L)测定结果如下:)测定结果如下:4.77 3.37 6.14 3.

4、95 3.56 4.23 4.31 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 4.56 4.37 5.39 6.30 5.21 4.71 4.56 4.37 5.39 6.30 5.21 7.22 7.22 5.54 3.39 5.18 5.77 4.79 5.12 5.20 5.54 3.39 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 4.38 4.89 6.25 5.32 5.10 4.70 4.74 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.47 3.40 3.91 4.

5、50 4.63 3.61 4.44 4.47 3.40 3.91 2.70 2.70 4.60 4.09 5.96 5.48 4.60 4.09 5.96 5.48 1 1)编制频率分布表并绘制分布图)编制频率分布表并绘制分布图 2 2)估计其频率分布的类型)估计其频率分布的类型 3 3)计算均数)计算均数 、标准差、标准差S S、变异系数、变异系数CVCV 4 4)计算中位数)计算中位数MM,并与,并与 比较。比较。2023-9-27表表2 某地某地40例健康成年男子血清胆固醇值的频数表例健康成年男子血清胆固醇值的频数表组段组段 划记划记 频数频数2.70 13.20 43.70 44.20

6、 104.70 95.20 65.70 36.20 26.70 07.207.70 1 合计合计 402023-9-27:作为陈述资料的形式,反映资料的分布类型;作为陈述资料的形式,反映资料的分布类型;对称分布对称分布 偏态分布偏态分布 正偏态正偏态 负偏态负偏态描述分布的两个特征:集中趋势、离散趋势描述分布的两个特征:集中趋势、离散趋势便于发现可疑值,及时查正;便于发现可疑值,及时查正;便于以后的计算指标及统计分析;便于以后的计算指标及统计分析;当样本含量较大时,可用频率作为概率的估计值。当样本含量较大时,可用频率作为概率的估计值。直方图:直方图:P14P14图图2-22-2,图,图2-3,

7、2-3,更直观的反映频数分布的类型。更直观的反映频数分布的类型。2023-9-27集中趋势的描述集中趋势的描述 平均数(平均数(average)是描述一组观察值的集中位置或平均水平是描述一组观察值的集中位置或平均水平的统计指标的统计指标 常作为一组数据的代表值用于分析和组间常作为一组数据的代表值用于分析和组间比较比较 常用的有:算术均数、几何均数、中位数常用的有:算术均数、几何均数、中位数2023-9-271.算术均数(算术均数(arithmetic mean)简称均数简称均数 总体均数用总体均数用表示表示 样本均数用样本均数用 表示表示 反映一组观察值在数量上的平均水平反映一组观察值在数量上

8、的平均水平 X2023-9-27(1)计算方法)计算方法 直接法直接法:式中,希腊字母式中,希腊字母(读作读作sigma)表示求和;表示求和;X1,X2,Xn为各观察值;为各观察值;n n为样本含量,即观察值的个数。为样本含量,即观察值的个数。nXXXnXXn212023-9-27频率表法:频率表资料或相同观察值较多时频率表法:频率表资料或相同观察值较多时 式中,式中,X0与与f分别为频数表资料中各组段分别为频数表资料中各组段的组中值和相应组段的频数的组中值和相应组段的频数(或相同观察值与或相同观察值与其对应的频数其对应的频数)。ffXX02023-9-27(2 2)均数的两个重要特性)均数的

9、两个重要特性 各离均差的总和等于零各离均差的总和等于零 离均差的平方和小于各观察值离均差的平方和小于各观察值X X与任何数与任何数a a (而(而aa均数)之差的平方和均数)之差的平方和 即均数是一组观察值最理想的代表值即均数是一组观察值最理想的代表值(3 3)均数的应用均数的应用:最适用于对称分布,特别是正态分布资料最适用于对称分布,特别是正态分布资料 不适于偏态分布资料不适于偏态分布资料2023-9-272.几何均数(几何均数(geometric mean)G 用于等比(或明显偏态)资料集中用于等比(或明显偏态)资料集中趋势的描述,反映其平均增减倍数。趋势的描述,反映其平均增减倍数。202

10、3-9-27(1)计算方法)计算方法直接法直接法 或或 频率表法:相同观察值的个数较多时频率表法:相同观察值的个数较多时nnXXXG.21)lg(lg)lg.lglg(lg1211nXnXXXGn)lg(lg.lg.lglg(lg12122111fXffffXfXfXfGkkk2023-9-27(2):等比资料如抗体的平均滴度、平均发展等比资料如抗体的平均滴度、平均发展速度人口的几何增长(增长速度);或用于速度人口的几何增长(增长速度);或用于对数正态分布资料。对数正态分布资料。*注意注意 观察值不能有零观察值不能有零 观察值不能同时有正值和负值观察值不能同时有正值和负值 同一组资料几何均数小

11、于均数同一组资料几何均数小于均数2023-9-273.中位数中位数 中位数(中位数(median,M)是将一组观察值从小)是将一组观察值从小 到大排列,位次居中的观察值。到大排列,位次居中的观察值。百分位数(百分位数(percentile),位置指标,位置指标,Px,将,将 总体或样本的全部观察值分为两部分,总体或样本的全部观察值分为两部分,理论上有理论上有x%的观察值比它小,有的观察值比它小,有 (100-x)%的观察值比它大。的观察值比它大。P50分位数即是中位数分位数即是中位数 2023-9-27(1)计算方法)计算方法*1)直接由原始数据计算中位数)直接由原始数据计算中位数 先按大小排

12、序先按大小排序 n为奇数时为奇数时 n为偶数时为偶数时2)1(nXM)(21122nnXXM式中下标式中下标 、为有序数列的位次。为有序数列的位次。、为相应位次的观察值。为相应位次的观察值。2n12n21n)21(nX)2(nX)12(nX2023-9-272)用频数表计算)用频数表计算M和和Px步骤:按所分组段,由小到大计算步骤:按所分组段,由小到大计算 累计频数和累计频率;累计频数和累计频率;按下式求按下式求M、Px 式中式中fx 为为Px 所在组段频数所在组段频数 i 为该组段的组距为该组段的组距 L为其下限为其下限 fL为小于为小于L各组段的累计频数各组段的累计频数)%.(LXfXnf

13、iLPx)2(LMfnfiLM2023-9-27(2):1)中位数常用于描述偏态分布资料的集中位置中位数常用于描述偏态分布资料的集中位置,反映位次居中的观察值的水平。只受居中变量值波反映位次居中的观察值的水平。只受居中变量值波动的影响。动的影响。对末端无确定数据的分布,对末端无确定数据的分布,不能直接不能直接求均数和几何均数时,求均数和几何均数时,可求中位数可求中位数。在对称分布资。在对称分布资料中,中位数与均数在理论上数值是相同的。料中,中位数与均数在理论上数值是相同的。2)百分位数用于描述样本或总体观察值序列在)百分位数用于描述样本或总体观察值序列在某百分位位置的水平。最常用的是某百分位位

14、置的水平。最常用的是P50、P5、P95等等2023-9-273)百分位数百分位数常用于确定医学参考值范围(正常值范常用于确定医学参考值范围(正常值范围),习惯上是确定只包括围),习惯上是确定只包括95%(或(或90%、99%等)等)的人的界值。的人的界值。双侧参考值范围双侧参考值范围 P2.5P97.5(如血压、心率)(如血压、心率)单侧参考值范围单侧参考值范围 P95或或P5(如尿铅(如尿铅/汞、血铅)汞、血铅)可用于任何分布的资料,特别是非特定分布的资料可用于任何分布的资料,特别是非特定分布的资料如如非正态分布资料。非正态分布资料。4)一般,分布中部的百分位数相对稳定,代表性好,)一般,

15、分布中部的百分位数相对稳定,代表性好,而两端的只在而两端的只在n足够大时才较稳定,足够大时才较稳定,当样本例数当样本例数n不够多时,不宜取太近两端的百分位数。不够多时,不宜取太近两端的百分位数。2023-9-27众数(众数(mode):指总体中出现机会最高):指总体中出现机会最高的数值。样本众数指在样本中出现次数的数值。样本众数指在样本中出现次数最多的数值。最多的数值。多用于离散型定量资料的描述。多用于离散型定量资料的描述。2023-9-27小结小结 计量资料集中趋势的描述常用计量资料集中趋势的描述常用 均数、几何均数、中位数均数、几何均数、中位数 均数均数适用于对称分布的资料适用于对称分布的资料 几何均数几何均数适用于等比资料或对数正态分布资料适用于等比资料或对数正态分布资料 中位数中位数可用于任何分布的资料,但原则上,适可用于任何分布的资料,但原则上,适合用均数或几何均数的资料,不采用中位数来合用均数或几何均数的资料,不采用中位数来描述其集中趋势。描述其集中趋势。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 统计学

copyright@ 2008-2023 1wenmi网站版权所有

经营许可证编号:宁ICP备2022001189号-1

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第壹文秘网,我们立即给予删除!