《医学统计学重点难点归纳.docx》由会员分享,可在线阅读,更多相关《医学统计学重点难点归纳.docx(36页珍藏版)》请在第壹文秘上搜索。
1、医学统计学重点难点归纳第一单元概论1.基本概念:总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。样本:从总体中随机抽取部分个体的某个变量值的集合。抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。概率:频率所稳定的常数称为概率。统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻
2、画和描述。统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。2.样本特点:足够的样本含量、可靠性、代表性。3.资料类型:(D定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。每个个体都能现察到一个观察指标的数值,有度量衡单位。(2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料)计数资料:是将观察单住按某种属性或类别分组,清点各组观察单位的个数(频数),由各分组标志及其频数构成。包括二分类资
3、料和多分类资料。二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。多分类:将观察对象按多种互斥的属性分类等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单位的个数所得的资料。4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。第二单元实验研究的三要素1.实验设计三要素:被试因素、受试对象、实睑效应2.误差分类:随机误差(抽样误差、随机测量误差)、系统误差、过失误差。3.实验设计的三个基本原则:对照原则、随机化分组原则、重复原则。4.实验设计方法,析因设计*正交试验设计均匀试验设计交互作用、两组:异体配对设Tr同体配对设并交叉设计无随机同期对照
4、实验设计(单因素两水平)扩展多组:单因素多水平一配伍组设计一A拉丁方设计(两因素多水平)(三因素多水平)配伍组设计:也称随机区组设计,将条件相近的受试对象配伍,每个配伍组中的对象随机分配到各处理组中。析因设计:考察两个或两个以上的处理因素,将各个因素的水平进行全面组合,每个组合下至少有两个以上的观察对象重复测量。一般来讲,应尽可能安排等重复试验,以简化计算,2-3个水平数。优点是全面性和均衡性较好,可同时分析处理因素的效应及因素间的交互作用。拉丁方设计:用于三因素等水平无交互。第三单元定量资料的统计描述、参考值范围1.频数表编制过程(了解)(1)找出样本数据的最大值和最小值,计算极差R;(2)
5、分组:确定分组的组距d和组数k:般n100,IO-15组(3)求频率密度:统计频数,算出频率、频率密度和累积频率:(4)画出直方图。2.频数表和直方图的作用:用于观察个数较多资料的统计描述,可以直观提示资料的分布特征和分布类型。3.集中趋势、离散趋势的指标及适用范围(1)集中趋势:X,G,M,P1,M0算术均数:适用于对称分布;不适用于偏态分布和资料中出现极值的资料。几何均数:适用于呈倍数关系的资料或对数正态分布的资料,尤其是正偏态分布。不适用与观察值中有0或正负数值同时出现的资料。中位数:适用于大样本偏态分布或分布情况不明的资料或资料中有不确定数值的资料。百分位数的作用:多个百分位数结合使用
6、,全面描述数据分布的特征;用于确定医学参考值范围(偏态或分布不明的资料)。众数:适用于大样本,较粗糙。(2)离散趋势:极差:优点:简单明了、容易使用。缺点:只反映最大值和最小值间的差异,不能反映其他观察值的变异程度。样本容量越大,极差可能越大。极差的抽样误差大,不稳定。四分位数间距:适用于确定医学参考值范围,与中位数一起描述偏态分布资料变异程度。缺点:类似于极差,利用度低。方差与标准差:与均数一起描述对称分布,特别是正态分布的分布特征。变异系数:适用于:适用于比较度量衡单位不同资料的变异度。比较均数相差悬殊的资料的变异度。衡量实验精密度和稳定性的常用指标。(3)频数分布特征高峰在中间,左右大致
7、对称,称为对称分布。平均数=中位数=众数高峰偏向小值的一侧(左侧),称正偏态分布(亦称右偏态)。平均数中位数众数高峰偏向大值的一侧(左侧),称负偏态分布(亦称左偏态)。平均数中位数众数对称分布正(右)偏态分布负(左)偏态分布4.正态分布图盘的特点及意义(1)特点:f(x)关于X=U对称X=时取得最大值在x=U0处为拐点,且以X轴为水平渐近线fG)大于OPG=a)=O若f(x)在点X处连续,则F(x)=f(X)(2)意义:/(x)=1,fG)在负无穷到正无穷的积分值为1,即曲线下方面积为1。5.U和(的意义:位置参数,当固定时,U增大,曲线沿横轴向右移动;U减小,曲线沿横轴向左移动。2:形状参数
8、,当U固定时,o越大,曲线越矮胖;。越小,曲线越高瘦。6.标准化变换Z=-xN(,2)zN(0,1)F()=()=e(z)即P(x)=()=P(zz)P(axP(=P(伫LZ7.标准正态分布界值规定:界值右侧曲线下方面积等于它的下角标。下角标一致,X轴上方中间面积一致。P(zz a) = 三2下限:P (zz,.) =1- aP (zz)=aP(zzq)=Ija8.正常值范围及意义概念:医学临床中,常将就诊者的某些生理、生化、免疫学指标的测定结果,与排除了对研究指标有影响的疾病和有关因素的大多数正常人”的相应数值进行比较,以就诊者的测定值是否超出了大多数正常人相应指标的波动范围,作为临床诊断的
9、重要参考,又称医学参考值范围。意义:95%的参考值范围含义是指:样本中有95%的个体测定值在所求范围之内。以95%的置信区间来说,意义是:该区间以95%的概率包含了待估计的参数,这种估计的可信度是95%,会冒5%的风险。公式:双侧95%的界限值:x1.96s单侧95用的上限值:%+1.645s单侧95%的上限值:%-1.645s第四章总体均数的估计、假设检验1.标准误(1)概念:每次样本计算出的X不同,这些X的标准差称为均数的标准误。(2)意义:是衡量样本统计量抽样误差大小的统计指标。(3)与标准差的区别:二者都是描述变异程度的指标,标准差描述个体值的变异,标准误描述统计量的变异。(4)均数标
10、准误的公式:St=T=2.置信区间(1)定义:设6为总体的未知参数,若由样本确定的两个统计量6,(x,、X?、n)和82(Xi、X2、n),JL,2,对于预先给定的值(0a1),若满足P(050)Z分布双侧:单侧:双侧:单侧:即即即即X aSX2土*XZgS2xz(4)两要素:准确度:由1-决定,1-a越大,准确度越高。精确度:由区间长度决定。99%置信区间准确度高于95%置信区间。95%置信区间精确度更高。3.抽样分布(Ot分布定义:来自正态总体的一组样本,X和S分别是样本的均数和标准差。则十=x-第s/4t分布,自由度df=n-1,极限分布是标准正态分布。图形分布特征:以0为中心,左右对称
11、的单峰分布。自由度越大,越高瘦界值:双侧:P(ItlWtg)=I-a2P(tta)=-I2单侧:上限:下限:P(tt.)=I-QP(tt.)-aP(tt-u)-Va(2)X2分布定义:若从均数为U,标准差的正态总体中,每次抽取样本含量为n的样本,计算样本标准差S,则XJCn-Ds2/。?服从自由度df=n-1的x2分布。图形分布特征:曲线偏向左边自由度越小曲线越偏界值:下限:P (2xL) =1-aP (2xL) = a双侧:P(x2)=W2P(22)=QP(X%。)=1-a(3)F分布定义:如果分别从两个正态总体N(,%)和N(h,1)中随机抽取样本含量m、%的两个样本,算出样本均数和方差分
12、别为,s:和工,s;,则2月艮从dfl=n-1,df2=n2-1的F分布。若X-Xz分别服从自由度dfi、df?的X?分布,则F=ZL空!dfdfz图形分布特征曲线偏向左边df1,dfz同时增大,曲线趋向于对称倒数性质:Rs*rMaf、或、界值:双侧:PCFF)-7P(F茨上FPCFF)=P(FF)=1-a4.假设检验P(FF,-0)=1-aP(KF)=a(1)基本思想:反证法、小概率事件原理(2)基本步豚:建立假设,确定检验水准HO:原假设,差异存在但不显著或差异无统计学意义H1:备择假设,差异显著或差异有统计学意义在原假设成立条件下,选择统计方法并计算检验统计量。(认为误差由抽样产生)参数检验统计量要求满足:i)在HO成立的条件下,服从特定的抽样分布:ii)必须包含要检验的总体参数:iii)对于给定的样本数据,能计算出该检验统计量的数值。对于给定的值做出检验结论,并给以专业解释判断P值:(与界值比较,反查界值表确定范围,软件计算)若Pa,则接受H0,拒绝M;若P