《医学统计学大题重点知识总结.docx》由会员分享,可在线阅读,更多相关《医学统计学大题重点知识总结.docx(10页珍藏版)》请在第壹文秘上搜索。
1、一、描述集中位置的指标应用适用范围【筒】平均数:算数均数、几何均数、中位数、百分位数。1、算数平均数:适用于单峰对称分布或近似于单峰对称分布的资料2、几何均数:适用于对数变换后单峰对称的资料。eg等比资料、滴度资料、对数正态分布资料3、中位数:理论上可用于任何分布资料,但当资料适合计算均数或几何均数时,不宜用中位数。Eg:偏态分布、分布不明资料、有不确定值的资料.4、百分位数:适用于任何分布的资料。二、描述离散趋势的指标【简】变异度:极差、四分位数间距、标准差、方差、变异系数。1、极差:又称全距,是一组数据中最大值和最小值之差。极差大说明资料的离散度大。优点:简单明了缺点:不灵敏和不稳定。样本
2、例数相差悬殊时,不适宜比较其极差。2、四分位数间距:即中间一半观察值的极差。四分位数间距较全距稳定,常与中位数一起,描述不对称分布资料的特征。3、标准差:基本内容是离均差,它显示一组变量值与其均数的间距,故标准差直接地、总结地、平均地描述了变量值的离散程度。在同质的前提下,标准差大,表示变量值的离散程度大,即变量值的分布分散、不整齐、波动较大;标准差小,表示变量值的离散程度小,即变量值的分布集中、整齐、波动较小。4、方差:利用了所用的信息,与变异度和变量值的个数有关。5、变异系数(CV):变异系数派生于标准差,其应用价值在于排除了平均水平的影响,并消除了单位。三、正态分布特征1、单峰分布;高峰
3、在均数处;2、以均数为中心,均数两侧完全对称。3、正态分布有两个参数(Parameter),即位置参数_(均数)和变异度参数_(标准差)。4、有些指标本身不服从正态分布,但经过变换之后可以服从正态分布。5、正态曲线下的面积分布有一定的规律。四、参考值范围(含义+原则)【简】1、含义:(1)又称正常值范围,是绝大多数正常人的某观察指标所在的范围。绝大多数:90%,95%,99%等等。(2)确定参考值范围的意义:用于判断正常与异常。(3)“正常人”的定义:排除了影响所研究的指标的疾病和有关因素的同质的人群。2、原则:(1)选定足够例数的同质的正常人作为研究对象;(2)控制检测误差;(3)判断是否分
4、组(性别,年龄组);(4)单、双侧问题;(5)选择百分界值(90%,95%);(6)确定可疑范围。五、假设检验的步骤简1、建立假设零假设(nu1.1.hypothesis),记为Ho;HO:=0;备择假设(a1.ternativehypothesis),记为H1.;H1.:04.2、确定检验水准一般取=0.05;小概率事件的判断标准3、选定检验方法计算检验统计量(计算样本与总体的偏离)V=n-(统计量t表示,在标准误的尺度下,样本均数与总体均数0的偏离。这种偏离称为标准t离差)根据抽样误差理论,在HO假设前提下,统计量t服从自由度为nT的t分布,即t值在0的附近的可能性大,远离。的可W品能性小
5、,离0越远可能性越小。t值越小,越利于HO假设;t值越大,越不利于HO假设4、计算概率P(与统计量t值对应的概率)在HO成立的前提下,获得现有这么大的标准t离差以及更大离差的可能性。P=P(t2.841)?按v=25T=24查附表2的t界值表5、推断性结论当P时,拒绝HO,接受H1.,差别有统计学意义。当Pa时,不拒绝H0,差别尚无统计学意义。六、第一类错误与第二类错误:HO真实HO不真实拒绝H0,接受H1.第一类错误(Q)正确推断(I-B)不拒绝HO正确推断(1a)第二类错误(B)统计学上规定:HO真实时被拒绝为第一类错误(又称I型错误),Ho不真实时不拒绝为第二类错误(又称II型错误)。C
6、I与B间关系:(!与B相互制约。a大,B小;a小,B大。P值的意义:从HO总体中随机获得等于或大于现有统计量值的概率。拒绝HO时所冒的风险。a的意义:I型错误的概率。根据研究者的要求在计算检验统计量之前设定的。确定a=0.05,即I型错误的概率为0.05,理论上100次抽样中发生这样的错误平均有5次。检验效能:又称把握度。1-B两总体确有差别,按a水准能发现它们有差别的能力。(例如I-B=O.9,意味着若两总体确有差别,则理论上100次抽样研究中,平均有90次能得出有差别的结论。)七、秩和检驶的优缺点和适用范围【简】1、秩和检验的适用范围:(1)主要对等级资料进行分析;(2)秩和检验可用于任意
7、分布(distributionfree)的资料;(3)非参数统计的主要优点是不受总体分布的限制,适用范围广。(4)非参数统计的主要缺点是符合参数检验的资料(如两样本均数比较的t检验),如用非参数检验,因没有充分利用资料提供的信息,检验效率降低。2.秩和检验优缺点:优点:非参数统计的主要优点是不受总体分布的限制,适用范围广。适用于有序分类资料,偏态分布资料,变异较大或方差不齐的资料,分布类型不明的资料及有特大特小值或数据的一端或两端有不确定数值的资料。缺点:非参数统计的主要缺点是符合参数检验的资料(如两样本均数比较的t检验),如用非参数检验,因没有充分利用资料提供的信息,检验效率降低。八、秩和检
8、验和X2检验的基本思想【简】(-)秩和检验1、如果HO成立,即两组分布位置相同:则A组的实际秩和应接近理论秩n1.(N+1.)2;B组的实际秩和应接近理论秩和n2(N+1.)2或相差不大,差值很大的概率应很小。2、如果相差较大,超出了预定的界值,则可认为HO不成立。(-)X2检验基本思想:若Ho成立,则四个格子的实际频数A与理论频数T之差异纯系抽样误差所致,故一般不会很大,X2值也就不会很大;在一次随机试验中,出现大的X2值的概率P是很小的。因此,若根据实际样本资料求得一个很小的P,且Pa(检验水准),根据小概率原理,就有理由怀疑HO的真实性,因而拒绝它;若Pa,则没有理由拒绝HO九、四格表x
9、2的检验的应用条件【重要】n40,T5,用X2;(2)n40,但IVT5,用校正X2。T对基本公式的校正)(ac)(bd)对四格表专用公式的校正n40,或T1.,用FiSher精确概率计算法。十、实宴研究的基本要素:【筒】处理因素:一般是指外加于受试对象,在实验中需要观察并阐明其效应的因素。【服用试验药、对照药(一个处理因素,两个水平)】受试对象:是处理因素作用的客体。【原发性,轻、中度高血压】实验效应:是指受试对象接受实验处理后所出现的实验结果,通常由人或动物的相应的各项指标来反映。【收缩压、舒张压的下降值】十一、实验设计的基本原则:【简】1、对照原则(均衡性);2、随机化原则(客观性);3
10、、重复原则(可靠性)。对照:衬托处理因素的作用。随机:(1)抽样随机:每一个符合条件的实验对象参加实验的机会相同,即总体中每个个体有相同的机会被抽到样本中来;(2)分组随机:每个实验对象分配到不同处理组的机会相同;(3)实验顺序随机:每个实验对象接受处理先后的机会相同。随机化分组,不仅能控制已知的混杂因素(非研究因素),而且还能控制未知的混杂因素重复:(1)整个实验的重复(2)用多个实验单位进行重复(样本含量)(3)同一实验单位的重复观察十二、研究常见类型:根据计算题目判断属于I1种设计(1)完全随机设计(成组设计):从不同总体中随机抽样,通过对样本的分析,比较不同总体的特征。将同一个总体(同
11、质)的样本随机分配到不同的处理组,观察不同处理的效应。(2)配对设计:总体同质性差,按某种条件配对,对内随机自身配对(前后对照,左右对照,一分为二):条件相近异体配对(3)随机区组设计:总体同质性差,部分同质性好。区组控制,区组内随机。是配对设计的扩展。【计算】一、配对设计定置资料的t检验配对设计有两种情况自身配对:同一对象接受两种处理,如同一标本用两种方法进行检验,同一患者接受两种处理方法;异体配对:将条件相近的实验对象配对,并分别给予两种处理。步骤:首先求出各对数据间的差值d;若两处理因素的效应无差别,差值d的总体均数d应该为0,故可将该检验理解为样本均数2与总体均数Ud=O的比较。/=d
12、_v(自由度)=对子数-1【例1】为研究某新的降压药对高血压患者舒张压的影响,1.机抽取了10名高血压患者,分别在其用药前和用药后一个月刑其舒张压,试问该降压药对高血压患者的舒张压是否有影响?H1: dO,用药前后的舒张压不同。表13两组乳猪aR特3含wM乳猪号对照组实殴组卷值dd210.35500.27550.07950.00632020.20000.2545-0.05450.00297030.31300.18000.13300.01768940.36300.32300.04000.0016005P0.002。按=0.05水准,拒绝H0,接受H1,差别有统计学意义,可以认为高血压患者用药后舒
13、张压降低。【例2】例4.6某医生研究脑缺题对脑组织中生化指标的影响,将乳猪按出生体重配成7对,一组为对照组,一组为脑缺触模型组。试比较两组猪脑组织钙泵的含有无差别。M9r*4/1JS3B27S.rw(1.eoO202M.0MSQjOZm3JIJQllnB U3S(LeiaMO*423Q(MnQCDMMSJM4JIU.MilQOMVMlawi41io7* MMQflMmAit JMOJtmitHO:d=0,即两组乳猪脑组织钙泵含量相等;H1.:d0,即对照组乳猪脑组织钙泵含量高于实验组,单侧=0.05o0.04410.05717=2.0412按v=n1.=71.=6查t界值表,得PV0.05,按
14、a=0.05水准,拒绝H0,接受H1.,差别有统计学意义,可以认为脑缺氧可造成钙泵含量的降低。二、成组设计计资料的t检验(两样本均数比较的t检验)完全随机设计:1、受试对象被随机分配到两组中,分别接受不同的处理;2、从两个总体中随机地抽取一部分个体进行研究;3、例如手术组与非手术组、新药组与对照组等。目的:推断HI=2/22m+/12-22(T)5+(%-1)$2SVTT媪S”-Xi-X2t=t检验公式为:S丸-彳2,【例】某医生研究转铁蛋白对病毒性肝炎诊断的临床意义,测得12名正常人和13名病毒性肝炎患者血清转铁蛋白含(gd1.),问患者和正常人转铁蛋白含量是否有差异?12名正常人和13名病毒性肝炎患者血清转铁蛋白含量(gd1.)正常人(X1)265.4271.5