《临床研究中常用统计分析方法和选择.ppt》由会员分享,可在线阅读,更多相关《临床研究中常用统计分析方法和选择.ppt(39页珍藏版)》请在第壹文秘上搜索。
1、临床研究中常用统计分析方法和选择u统计学方法有什么用?u合理选择统计方法的四个因素u数据资料的描述u数据资料的组间比较u变量间关系研究主要内容一张关于统计学的图片一、统计学方法有什么用?例子例子1:一研究者宣布找到一种治疗某病的新药,:一研究者宣布找到一种治疗某病的新药,试验的结果如下:试验的结果如下:药物例数有效有效率新药604270%安慰剂502550%该新药是否值得推广?该新药是否值得推广?几个例子几个例子假设检验及临床优效性检验假设检验及临床优效性检验例子例子2 2:英国某年全人口统计资料:英国某年全人口统计资料矛盾:移民组的发病率在各个年龄组均高于英格兰和威尔矛盾:移民组的发病率在各
2、个年龄组均高于英格兰和威尔士组,为什么它的合计发病率反而低?士组,为什么它的合计发病率反而低?分析中混杂因素的控制分析中混杂因素的控制 胃癌胃癌 228 235 143 187 250 胃炎胃炎 100 153 178 143 200 非胃病非胃病 98 123 170 100 120 例子例子3 3:为鉴别胃癌、胃炎、非胃病患者,各测定了为鉴别胃癌、胃炎、非胃病患者,各测定了5050名对象的铜兰蛋白等指标,其中铜兰蛋白的观察结果如名对象的铜兰蛋白等指标,其中铜兰蛋白的观察结果如下下: :问:三种人的铜兰蛋白有无不同?问:三种人的铜兰蛋白有无不同?能否根据测定的铜兰蛋白数据对患者进行初步诊断?
3、能否根据测定的铜兰蛋白数据对患者进行初步诊断?假设检验及判别诊断假设检验及判别诊断 结局指标:心性死亡结局指标:心性死亡 预后因素:年龄、性别、高血压病、心梗位置、心梗分级、预后因素:年龄、性别、高血压病、心梗位置、心梗分级、 传导阻滞、溶栓治疗,传导阻滞、溶栓治疗,.,等,等例子例子4 4:研究心肌梗死患者预后的影响因素,研究心肌梗死患者预后的影响因素,以以是否发是否发生生心性死亡心性死亡作为观察结果指标作为观察结果指标,对对116116名心梗患者的名心梗患者的2222个可能影响预后的因素进行观察和记录个可能影响预后的因素进行观察和记录哪些预后因素与发生心性死亡有关系?哪些预后因素与发生心性
4、死亡有关系?关系的强度如何?关系的强度如何?影响因素筛选影响因素筛选回归分析回归分析统计学在医学科研中作用n 统计学是进行医学科研的重要工具重要工具n 满足统计学原则要求是保障医学科研科学性的前提n 采用恰当的统计学方法是研究结论可靠、可信的前提n 课题申报、论文撰写均有明确的统计学要求u研究设计u分析目的u资料类型u数据特征二、合理选择统计方法的四个因素n完全随机设计(成组设计)完全随机设计(成组设计)-最常见,最易实施的实验设计方案-将研究对象随机分配随机分配到几个组,然后做实验n配对设计配对设计( (区组设计区组设计) )-将具有相似特征的研究对象配成对子,然后再将每个对子的对象随机分配
5、随机分配到两个组进行实验-常见形式:同源配对(如样品一分为二) 异源配对(按性别、体重、年龄配对) 自身前后配对(试验前后的对比)(一)研究设计(一)研究设计n析因设计析因设计 -同时研究多个实验因素多个实验因素对结果的影响 -例如,研究药物剂量药物剂量(3mg、6mg)及给药方式给药方式(口服、肌注口服、肌注)对结果的影响,每种组合均需要做试验(3mg+口服,3mg+肌注, 6mg+口服,6mg+肌注),为22析因设计析因设计n重复测量设计重复测量设计 -同一对象在不同时间点不同时间点上进行某个指标的观测,以分析该指标在时间上的变化。-临床上很常见的一类资料(一)研究设计(一)研究设计n对临
6、床资料进行统计描述 描述性统计分析方法 如,均数,中位数,标准差,百分比,频数分布等n估计总体参数 95%可信区间n对几组资料进行差异性检验 假设检验方法 如,t检验,卡方检验,方差分析,秩和检验等n探讨变量之间的关系,或者自变量(影响因素)自变量(影响因素)对应变量(结果变量)应变量(结果变量)的影响大小 多变量分析方法 如,线性相关,线性回归,Logistic回归,Cox回归、生存分析等(二)分析目的(二)分析目的数值变量资料数值变量资料 计量资料计量资料无序分类变量资料无序分类变量资料 计数资料计数资料 有序分类变量资料有序分类变量资料 等级资料等级资料(三)资料类型(三)资料类型无序分
7、类无序分类:指类别或属性间无顺序、程度之分例如,性别(男、女)为二分类 血型(A、B、AB、O)为多分类 有序有序分类分类:指类别间存在着次序,或程度上的差异。 例如,治疗效果:无效、好转、显效、治愈 实验室检验:、+、+、+数值变量数值变量:每一个观察对象都有一个数值,且大小差异有意义例如,血红蛋白(g/L),住院天数,产前检查次数,住院费用n任何统计方法都有自己的适用条件,只有当某个或某些条件满足时,统计计算公式才成立n适用条件可根据数据特征来判断数据的分布特征(正态、偏态)方差齐性理论数大小样本量大小(四)数据特征(四)数据特征编号 年龄 性别 治疗组 舒张压 心电图 疗效 NO X1
8、X2 X3 X4 X5 X6 1 37 男 A 11.27 正常 显效 2 45 女 B 12.53 正常 有效 3 43 男 A 10.93 异常 有效 4 59 女 B 14.67 异常 无效 108 54 男 B 16.80 正常 无效108例高血压患者治疗后临床记录三、数据资料的描述三、数据资料的描述n通过绘制直方图直方图可以直观了解数据的分布(一)数值变量资料的描述(一)数值变量资料的描述偏态分布偏态分布近似正态分布近似正态分布变异水平变异水平 平均水平平均水平 平均水平平均水平偏态分布形状研究中,右偏态分布更常见,如研究中,右偏态分布更常见,如住院时间,住院费用,病程住院时间,住院
9、费用,病程等等左偏态分布较少见,如左偏态分布较少见,如考生成绩考生成绩有时呈左偏态分布有时呈左偏态分布n方差齐性 方差是否齐同(相等) 粗略判断 两组标准差之比在2.5倍以上,就得警惕方差不齐指标名称指标名称适用的资料适用的资料均数(X)正态分布或近似正态分布中位数(M)偏态分布、分布未知、两端无界几何均数(G)对数正态分布、等比资料标准差(s)正态分布或近似正态分布四分位数间距偏态分布、分布未知、两端无界极差(R)观察例数相近的数值变量变异系数(CV)比较几组资料间的变异大小描述数值变量资料的常用指标描述数值变量资料的常用指标变异水平变异水平 平均水平平均水平 平均水平平均水平偏态分布偏态分
10、布近似正态分布近似正态分布中位数中位数均数均数标准差标准差P25,P75四分位数间距四分位数间距n正态分布或近似正态分布: 均数 与 标准差n偏态分布或未知分布 中位数 与 P25、P75(四分位数间距)论文中最常用组合 通常需要描述各个类别的频数及频率频数及频率(百分比)(二)分类变量资料的描述二维频数表A A、B B 两组两组高血压患者高血压患者疗效比较疗效比较组别组别 治愈治愈 显效显效 有效有效 无效无效 合计合计 A 29 17 6 4 56 B 17 12 12 11 52 研究中通常需要列出二维频数表研究中通常需要列出二维频数表四、数据资料的组间比较四、数据资料的组间比较n假设检
11、验出发点是: 判断样本之间差异由什么原因造成的判断样本之间差异由什么原因造成的n样本样本数据间数据间的的差异差异有有两种原因所两种原因所致致 样本来自同一总体,差异因抽样误差所引起 样本来自不同总体,差异因不同总体所引起n假设检验以P P值值大小作为推断依据 P值大,表示差异由抽样误差引起可能性大 P值小,表示差异由抽样误差引起可能性小,即由总体不同引起的可能性大 一般以0.05作为临界值来判断(一)组间比较采用技术(一)组间比较采用技术-假设检验假设检验n根据资料类型选择根据资料类型选择计量资料的计量资料的假设检验假设检验 t检验、检验、F检验(方差分析)、检验(方差分析)、Z检验检验、秩和
12、检验、秩和检验(Wilcoxon秩和检验、秩和检验、H检验、检验、Friedman检验检验)等)等计数资料的计数资料的假设检验假设检验 卡方检验、卡方检验、Z检验检验等等等级资料的等级资料的假设检验假设检验 秩和检验(秩和检验(Wilcoxon秩和检验秩和检验、H检验检验、Friedman检验)检验)(二)组间比较常用的假设检验方法(二)组间比较常用的假设检验方法比较目的比较目的应用条件应用条件统计方法统计方法样本与总体比较样本与总体比较n n较大较大Z Z检验检验n n大小均可大小均可t t检验检验两组资料的比较两组资料的比较(完全随机设计)(完全随机设计)n n较大较大Z Z检验检验n n
13、较小较小, ,正态分布正态分布, ,方差齐方差齐t t检验检验n n较小较小, ,非正态分布非正态分布, ,方差不齐方差不齐WilcoxonWilcoxon秩和检验秩和检验tt检验检验1 1、常用、常用计量资料计量资料的假设检验的假设检验比较目的比较目的应用条件应用条件统计方法统计方法配对资料的比较配对资料的比较n n较大(任意分布)较大(任意分布)配对设计配对设计Z Z检验检验(配对设计)(配对设计)n n较小,差值为正态较小,差值为正态配对设计的配对设计的t t检验检验n n较小,差值为非正态较小,差值为非正态配对设计的秩和检验配对设计的秩和检验多组资料的比较多组资料的比较正态分布,方差齐
14、正态分布,方差齐方差分析方差分析(完全随机设计)(完全随机设计)非正态分布,方差不齐非正态分布,方差不齐秩和检验(秩和检验(H H检验)检验)配伍资料的比较配伍资料的比较正态分布,方差齐正态分布,方差齐配伍设计的方差分析配伍设计的方差分析(配伍设计)(配伍设计)非正态分布,方差不齐非正态分布,方差不齐配伍设计的秩和检验配伍设计的秩和检验(FriedmanFriedman检验)检验)1 1、常用、常用计量资料计量资料的假设检验(续表)的假设检验(续表)比较目的比较目的应用条件应用条件统计方法统计方法样本率样本率与总体率与总体率的比较的比较n n较小时较小时二项分布的直接法二项分布的直接法np5n
15、p5且且n(1-p)5n(1-p)5二项分布的二项分布的Z Z检验检验两个率两个率或构成比或构成比的比较(完全随的比较(完全随机设计)机设计)np5np5且且n(1-p)5n(1-p)5二项分布的二项分布的Z Z检验检验n40n40且且T5T5卡方检验卡方检验n40n40且且1T51T5校正校正卡方检验卡方检验n40n40或或T1T40b+c 40配对卡方检验配对卡方检验np5np5且且n(1-p)5n(1-p)5校正配对卡方检验校正配对卡方检验多个率多个率或构成比的比较或构成比的比较(完全随机设计)(完全随机设计)全部格子全部格子T5T5或或1T51T5小于小于25%25%卡方检验卡方检验T
16、1T1或或1T51T5超过超过25%25%FisherFisher精确检验精确检验2 2、常用、常用计数资料计数资料假设检验方法(续表)假设检验方法(续表)比较目的比较目的统计方法统计方法两组比较(完全随机设计)两组比较(完全随机设计)多组比较(完全随机设计)多组比较(完全随机设计)Wilcoxon秩和检验秩和检验秩和检验(秩和检验(H检验)检验)配伍设计配伍设计秩和检验(秩和检验(Friedman检验)检验)配对设计配对设计符号秩和检验符号秩和检验3 3、常用、常用等级资料等级资料假设检验方法假设检验方法 实例1 30只大鼠随机分为A、B、C三组,每组10只,分别给予三种药物,5天后测定某指标值如下表。 几个例子资料特点:完全随机设计,计量资料,三组资料特点:完全随机设计,计量资料,三组不妥的方法:t检验恰当的方法:方差分析 实例2 36只大鼠随机分为对照组、实验组1、实验组2三组,每组12只,分别给予三种饲料,分别于10天、15天、20天、25天测定大鼠体重,如下表。 资料特点:完全随机设计,计量资料,三组,重复测量资料特点:完全随机设计,计量资料,三组,重复测量不妥的方法:每个时