《计量资料的统计描述.ppt》由会员分享,可在线阅读,更多相关《计量资料的统计描述.ppt(72页珍藏版)》请在第壹文秘上搜索。
1、第二章第二章 计量资料的统计描述计量资料的统计描述第一节第一节 频数分布频数分布第二节第二节 集中趋势的描述集中趋势的描述第三节第三节离散趋势的描述离散趋势的描述第四节第四节 正态分布正态分布第五节第五节 医学参考值范围的制定医学参考值范围的制定第一节第一节 频数分布频数分布 一、频数分布表(一、频数分布表(frequency table)例例2-1 测得测得130名健康成年男子脉搏资料名健康成年男子脉搏资料(次次/分分)如下,试编制如下,试编制频数表和观察频数分布情况。频数表和观察频数分布情况。7576726966725768717269727382808267697364745870646
2、0776677646776757571656276727160677575737966697978707270727872677280687061707372718170667571637774766865776977757964797376618064697073696865706966816364807478768466707360768273646573736380687670797764706669737876 求出极差 确定组段数 确定组距 列出各个组段 确定每一组段频数选 极差即最大值与最小值之差 一般 815 之间 组距=R/组段数,但一般取一方便计算的数字 第一组段包括极小值,
3、最后一组段包括极大值,除最后一组段可同时标出上下限,其他组段只标出下限。根据变量值大小把各观察单位归入各个组段 编制频数表的步骤编制频数表的步骤编制频数表步骤流程图编制频数表步骤流程图(1)求极差求极差(range):即最大值与最小值之差,又称):即最大值与最小值之差,又称为全距。为全距。R84 57=27(次次/分分)(2)决定分组组数、组距决定分组组数、组距:根据研究目的和样本含量:根据研究目的和样本含量n确定分组组数,通常分为确定分组组数,通常分为815个组。组距个组。组距=极差极差/组数,组数,为方便计,组距为极差的十分之一为方便计,组距为极差的十分之一,再略加调整。再略加调整。27/
4、10=2.7 3 (3)列出组段列出组段:第一组段的下限略小于最小值,最后一:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值。个组段上限必须包含最大值。56 59 80 8385(4)划记计数划记计数:用划记法将所有数据归纳到各组段,得:用划记法将所有数据归纳到各组段,得到各组段的频数。到各组段的频数。频数表的编制步骤频数表的编制步骤表2-1 130名健康成年男子脉搏(次/分)的频数分布表Nf f 二、频数分布图三、频数表和频数分布图用途三、频数表和频数分布图用途1描述频数分布的描述频数分布的类型类型(对称分布、偏态分布)(对称分布、偏态分布)(1 1)对称分布)对称分布 :若:若
5、各组段的频数以中各组段的频数以中心位置左右两侧大心位置左右两侧大体对称,就认为该体对称,就认为该资料是对称分布资料是对称分布 是否为对称分布?是否为对称分布?(2)偏态分布)偏态分布:1)右偏态分布(正偏态分布):右侧的组段数多于)右偏态分布(正偏态分布):右侧的组段数多于左侧的组段数,频数向右侧拖尾。左侧的组段数,频数向右侧拖尾。血清转氨酶(mmol/L)051015202513.519.525.531.537.543.5.图2-2 115名正常成年女子血清转氨酶的频数分布人 数转氨酶含量 人 数 12 2 15 9 18 14 21 23 24 19 27 14 30 11 33 9 36
6、 7 39 4 4245 3 表表2-2 115名正常成年女子血清转氨名正常成年女子血清转氨酶(酶(mmol/L)含量分布)含量分布 2)左偏态分布(负偏态分布):左侧的组段数多于右侧的组段数,频数向左侧拖尾。血 清 肌 红 蛋 白(g/m L)05101520252.512.522.532.542.552.5图 2-3 101 名 正 常 人 血 清 肌 红 蛋 白 的 频 数 分 布人 数肌红蛋白含量 人 数 0 2 5 3 10 7 15 9 20 10 25 22 30 23 35 14 40 9 4550 2 表表2-3 101名正常人的血清肌红蛋白含量分布名正常人的血清肌红蛋白含量
7、分布g/mL2描述频数分布的描述频数分布的特征特征表表21数据的频数分布特征:数据的频数分布特征:数据数据的范围在的范围在5784(次(次/分分)数据数据在在6873(次(次/分)分)之间,尤以组段的人数之间,尤以组段的人数71(次(次/分)最多。分)最多。且上下组段的频数分布基本对称。且上下组段的频数分布基本对称。3便于发现一些特大或特小的可疑值便于发现一些特大或特小的可疑值 4便于进一步做统计分析和处理便于进一步做统计分析和处理第二节第二节 集中趋势的描述集中趋势的描述 统计上使用平均数(统计上使用平均数(average)这一指标体系来描)这一指标体系来描述一组变量值的集中位置或平均水平。
8、述一组变量值的集中位置或平均水平。常用的平均数有常用的平均数有:算术均数(均数)(算术均数(均数)(mean)几何均数(几何均数(geometric mean)中位数中位数(median)与百分位数()与百分位数(percentile)众数(众数(mode)一、算术均数一、算术均数算术均数:简称均数(算术均数:简称均数(mean)可用于反映一组呈对称分布的变量值可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位置在数量上的平均水平或者说是集中位置的特征值。的特征值。1、计算方法、计算方法(1)直接计算法)直接计算法 公式公式:12nXXXXXnn举例:试计算举例:试计算4,4,4
9、,6,6,8,8,8,10的均数?的均数?1323101836243X例例2-1 测得测得130健康成年男子脉搏资料健康成年男子脉搏资料(次次/分分)如下,试编制频如下,试编制频数表和观察频数分布情况。数表和观察频数分布情况。7576726966725768717269727382808267697364745870646077667764677675757165627672716067757573796669797870727072787267728068706170737271817066757163777476686577697775796479737661806469707369686
10、570696681636480747876846670736076827364657373638068767079776470666973787632.711307678727675X(2)加权法)加权法(利用频数表):利用频数表):公式:112233123kkkfXf Xf Xf Xf XXfffffX 本组段下限值+下组段下限值其中2k:频数表的组段数,:频数表的组段数,f:频数,:频数,X:组中值。:组中值。表2-2 130名健康成年男子脉搏(次/分)的频数分布表Nf ffXfXfXfX2 22 57.55 60.51 84.5931171.62()251130X 次 分2、应用、应用
11、均数均数适用于对称分布,特别适用于对称分布,特别是正态分布资料。是正态分布资料。二、二、几何均数(几何均数(geometric mean)可用于反映一组经可用于反映一组经对数对数转换转换后呈对称分布或正态分后呈对称分布或正态分布的变量值在数量上的平均布的变量值在数量上的平均水平。水平。几何均数(几何均数(geometric meangeometric mean)12121lg1lg(lglglg)lglgnnnGX XXXGXXXnnXGn为正值,为底的反对数表示以为底的对数;表示以010lg10lg1X几何均数几何均数:变量变量对数值的对数值的算术均算术均数数的反对数的反对数。其他对数(如自
12、然对数)变换获得相同的几何均数例例2-5 有有8份血清的抗体效价分别为份血清的抗体效价分别为1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640,求平均抗体效价。求平均抗体效价。57.566403201608040201058G1lg(lg5lg10lg20lg640)/856.57G平均抗体效价为:平均抗体效价为:1:57(2)加权法)加权法公式:公式:1lglg()fXGf 例例2-6 69例类风湿关节炎(例类风湿关节炎(RA)患者)患者血清血清EBV-VCA-lgG抗体滴度的分布见表抗体滴度的分布见表2-4第第(1)、(2)栏,求其平均抗体滴度。栏,求其平均
13、抗体滴度。111lg150.2778lg()lg()lg(2.1779)150.669fXGf2、应用:、应用:适用于成等比数列的资料,适用于成等比数列的资料,特别是服从对数正态分布资特别是服从对数正态分布资料。料。三、三、中位数与百分位数中位数与百分位数11个大鼠存活天数:个大鼠存活天数:4,10,7,50,3,15,2,9,13,60,60平均存活天数平均存活天数?(一)中位数(一)中位数(median)是将每个变量值从小到大排列,是将每个变量值从小到大排列,位置位置居于中间的那个变量居于中间的那个变量。计算计算公式公式:n为奇数时为奇数时 n为偶数时为偶数时 1()2nMX()(1)22
14、12nnMXX例例2-3 9名中学生甲型肝炎的潜伏期名中学生甲型肝炎的潜伏期分别为分别为12,13,14,14,15,15,15,17,19天,求其天,求其中位数中位数。88451222214 15 214.5()MXXXX如果只调查了前八位中学生,则:()()天)(155219天XXM频数表资料的中位数频数表资料的中位数(50%)(50%)LmMnnfMLif 所在组段下限值至该下限值的累计频数组距所在组段下限值至上限值间的频数下限值下限值L上限值上限值Ui;fm中位数中位数M)%50(Lfn例21频数表中位数的计算Nf f中位数71+3x(130 x50%59)/2671.69应用应用1、
15、各种分布类型的资料、各种分布类型的资料2、特别适合大样本、特别适合大样本偏态偏态分布资料或分布资料或者者一端或两端无确切数值的资料一端或两端无确切数值的资料。%X(100)%XXP 百分位数示意图百分位数示意图(二)百分位数(二)百分位数(percentile)例例 对某医院细菌性痢疾治愈者的住院对某医院细菌性痢疾治愈者的住院天数统计,天数统计,120名患者的住院天数从小到大名患者的住院天数从小到大排列如下,试求排列如下,试求第第5百分位数和百分位数和第第99百分位百分位数。数。患患 者者:住院天数住院天数:(1)n=120,为整数为整数:5(6)(7)11(34)3.5()22PXX天120
16、 5%61 2 3 4 5 6 7 8 9 117 118 119 120 1 2 2 2 3 3 4 4 5 40 40 42 452频数表法 公式:(%)XXXLXiPLnXff XL:第 X 百分位数所在组段下限 Lf:小于XL各组段的累计频数 Xi:第 X 百分位数所在组段组距 n:为总例数 当 时,公式(2-9)即为中位数的计算公式50505050()2LinMPLff1%50%2X 例例2-9 试分别求例试分别求例21频数表的第频数表的第25、第、第75百分位数。百分位数。P2565+3x(130 x25%19)/1565.90P7574+3x(130 x75%85)/1974.66 设有甲、乙、丙三名医生,分别对相同的设有甲、乙、丙三名医生,分别对相同的5份血样进行份血样进行红细胞计数(万红细胞计数(万/mm3),甲得出了),甲得出了560、540、500、460、440,乙得出了,乙得出了520、510、500、490、480,丙得出了,丙得出了510、505、500、495、490,见下图,见下图2,三名医生的计数结果得,三名医生的计数结果得到的均数均为到的均数均为5