《meta分析原理和步骤.ppt》由会员分享,可在线阅读,更多相关《meta分析原理和步骤.ppt(42页珍藏版)》请在第壹文秘上搜索。
1、Meta analysis原理和实施步骤样本与总体 研究总体离不开研究它的个体但在许多实际问题中,不可能对所有个体逐一进行研究,而只能从总体中抽取一部分个体进行观察(或试验),根据对这部分个体的观察结果来推断总体的分布情况样本总体推断样本与总体u统计学用抽样分布的理论来描述样本统计量的变化规律u单一样本推断总体存在不足: 存在抽样误差,并且抽样误差的大小与样本量的大小有关。u为了减小抽样误差,需要足够的样本量 样本推断总体存在抽样误差足够的样本量减小误差 从一个均数为1.5,标准差为0.7的正态总体中进行随机抽样,样本量分别为20,50,100,200,300,500,1000,不同的样本量均
2、进行20次抽样,共得到140个样本。 分别计算每个样本的均数,标准差和标准误。 以样本的均数为横坐标,以样本量为纵坐标作散点图 由于抽样过程存在抽样误差,样本量较大时抽样误差较小。 所以从图中可以看出所有的点以样本量较大时的均数为轴,左右是基本对称的。 用方差分析的方法对不同的样本所对应的总体均数是否相等进行检验,方差分析的结果为F=0.862,P=0.878。 说明140个样本对应的总体均数是相同的。 用这140个样本的信息来估计总体的均数和标准差,=1.501,=0.699。 这样做的结果是提高了估计的精度。理想状态 我们把不同作者对相同问题进行的研究可以看作从同一总体中进行抽样得到的一个
3、随机样本,如果他们都是按照相同的设计得到的研究结果,并且我们可以找到每一项研究的结果,这样就可以根据上面的原理得到一个更为可靠的结果。实际情况 不同作者:u 所使用的设计方案会有一定的差别u 选择的实验对象有所不同u 样本量差异 因此实际能够得到的资料可能是不完整的,甚至是有 偏性的,如阳性结果的文章,以及和目前大家普遍能 够接受的观点一致的文章可能更容易发表在专业杂志上。 Meta 分析 Meta(after, more comprehensive,secondary)希腊词u定义 以综合研究结果为目的,通过查阅文献收集与某一特定问题相关的多个研究并对这些研究的结果所进行的统计分析u优点 几
4、个、甚至上百个研究者在不同地区进行研究并发表研究结果进行整合后所得到的综合结果(证据)更有说服力Meta分析的意义u海量信息需要整合u避免“只见树木不见森林”u克服传统文献综述的缺陷u连接新旧知识的桥梁传统文献综述的缺陷u主观综合u缺乏共同遵守的原则和步骤u注重统计学是否“有意义”u等价对待每篇文献,无权重u定性而非定量Meta分析的功能u定量综合u提供系统的、可重复的、客观的综合方法u通过对同一主题多个小样本研究结果的综合,提高原结果的统计效能,解决研究结果的不一致性,改善效应估计值u回答原各研究未提出的问题Meta分析原理固定效应模型(fixed effect model)假设各个研究之间
5、只有一个真效应值(true effect size),研究直接观测到的效应值的差别来源于抽样误差(正态分布)随机效应模型(random-effect model)假设各个研究间(如不同国家,不同种族等),的真效应值是相互不同的,且各个研究的值服从正态分布,因此最后观测值的差别既包括真效应值的随机误差也包括抽样误差(正态分布)。固定效应模型 圆形代表各个研究的真效应值 方形代表各个研究的实际观测值 代表抽样误差真效应值相同观测值的差异仅来源于抽样误差 抽样误差符合正态分布根据此分布特征,可以根据各个研究的值估计真效应值(类似于通过样本的效应值来推断总体的效应值)估计真效应值的方法 考虑到各个研究
6、间抽样误差大小不同,因此对每个研究需要根据误差大小进行加权。 权重为: VYi为每个研究内部的方差 因此所有研究加权均数为 Yi为研究的观测值 估计的总效应均数的方差为:(估计均数的权重等于方差的倒数) 从而得到总效应值均数标准差: 得到均数估计的95%置信区间:随机效应模型 各个研究的真效应值不是同一的,而是服从正态分布的各个研究观测值的差别包括真效应值的误差()和抽样误差() 为各研究真效应值的平均值估计真效应值的方法估计方法和固定效应模型一样,区别在与随机效应模型需要考虑到真效应值之间的差异,即各个研究之间的方差 各个研究的权重: 其中2表示各个研究之间的方差 从而加权以后的平均值为 估
7、计的总效应均数的方差为 从而得到总效应值均数标准差: 得到均数估计的95%置信区间:估计2的方法 (类似于样本均数求方差的过程) 加权离均差平方和(weighted sum of squares,WSS)(此部分为总的变异度) 因此随机效应部分应该是加权总和减掉预期的离均差平方和,即超额变异(excess variance) 预期的总变异的假设是各个研究真效应值相同,即其预期变异度为其自由度因此,超额变异=观测WSS-预期WSS=Q-df但是此时的超额变异是标准化后的总和,不依赖真效应的度量,且随着研究数量的增加和增加,因此需做转换,以原始的效应值度量衡量,并做平均,因此除以数量C。结果均用森
8、林图表示固定效应模型与随机效应模型的比较固定模型随机效应模型真效应值各个研究的值均相同各个研究正态分布的平均值权重样本量小的一般权重较小,而样本量大的权重较大样本量小的研究权重不会过分小,而样本量大的研究权重也不会过分大置信区间比随机模型窄比固定模型宽两种模型的选择u 模型的选择应该根据各个研究本身的分布特点选择。一般医学研究中根据发表的文献进行分析,随机效应模型比较适合。u 但是,如果只是因为异质性检验具有统计学差异,就从固定模型转为随机效应模型,这种做法是错误的,不推荐。u 如果固定效应模型下,异质性较大,首先应考虑是否有异常研究纳入,通过敏感性分析进行排除,或者做亚组分析,若异质性仍较大
9、,考虑是否因为本身选择固定效应模型不合适,尝试选择随机效应模型Meta分析实施步骤 一、选题和立题形成问题:1.相关性研究(病因学和危险因素);2.干预措施的评价; 3.诊断方法评价;4.预后估计;5.病人费用和效益分析等。u 合理选择对象:应对要解决的问题进行精确描述,包括人群类型(疾病确切分型、分期) 、治疗手段或暴露因素的种类、预期结果等,合理选择进行评价的指标 。u 合理选择指标:指标的选择直接影响文献检索的准确性和敏感性,关系到制定检索策略。u 制定纳入排除标准。 二、文献检索 检索策略的制定pubmed中Mesh联合free word检索。 文献检索国内的有维普全文VIP,CNKI
10、,万方数据库,外文的有pubmed ,SD,OVID等。 文献管理使用endnote,noteexpress等文献管理软件进行检索和管理文献 文献检索方法:pubmed检索、google学术检索、若网上无法获取全文考虑给作者发email文献筛选摘要全文阅读阅读过程中参考文献中的文章重新搜索是否有最新文献三、文献的质量评价评价内容该研究的试验设计是否明确,包括研究人群、治疗手段和结果判定方法; 试验对象是否随机分组; 病人的随访率是否理想及每组病人是否经过统计分析; 受试对象、研究人员及其它研究参与者是否在研究过程中实行“盲法”; 各组病人的年龄、性别、职业等是否相似; 除进行研究的治疗手段不同
11、外,其它的治疗是否一致; 治疗作用大小; 治疗效果的评价是否准确; 试验结果是否适用于当地的人群,种族差异是否影响试验结果; 是否描述了所有重要的治疗结果; 四、提取数据 文献作者、年代、来源、 研究设计特征(设计方法、组别、盲法等) 研究对象特征(地域、样本量等) 干预特征(干预方法、是否盲法、剂量等) 评价指标(仪器、指标、持续时间等) 质量等u研究者应设计一个适合本研究的数据收集表格。u表格中应包括分组情况、每组样本数和研究效应的测量指标。根据研究目的不同,测量指标可以是率差、比数(odds) 、相对危险度( relative risk ,包括RR 和OR) 。u各研究间作用测量指标不一
12、致,需转化为统一指标。 五、分析资料和报告结果u计算各研究的效应值、方差和权重 u对各研究结果的效应值进行齐性检验 u计算合并的效应值 固定效应模型的合并效应值 随机效应模型合并的效应值u绘制各研究的效应值和置信区间 森林图 (Forest Plot)异质性检验异质性种类u 临床异质性u 观察对象u 年龄,性别,人种,疾病程度,病程长短u 干预措施u 剂量,给药途径,疗程u 结果测量指标u 量度,测量时间,测量方法异质性检验的方法uI2:异质性的定量分析uI2值从0%至100%,0%时无异质性,I2值越大,异质性越大;一般说来,用I2=25%,或50%,或75%将异质性划分为低,中,高;u 小
13、于70可接受,超过70则建议分开描述,不能合并。uI2描述了去除抽样误差(机遇)后的异质性。异质性小只说明各个研究间研究方法、纳入标准、实施方案等没有大的差别 存在异质性可采取的措施:u 得到每个研究的原始数据,并可对每个研究可以采用统一的多元回归模型进行分析,避免由于模型不一致导致的异质性u 亚组分析。u 敏感性分析。在排除可能是异常结果的研究后,重新进行Meta分析,与未排除异常结果研究的Meta分析结果进行比较,探讨被去除的研究对合并效应的影响程度。u 选用Meta回归以及混合模型进行分析u 若异质性过于明显,则应放弃进行Meta分析,只对结果进行一般性的统计描述。Meta回归u Met
14、a回归分析采用回归分析的方法探讨某些实验或病例特征等协变量对Meta分析中合并效应的影响以试图明确各研究问异质性的来源。探讨协变量对合并效应的影响。u 纳入Meta回归分析中的协变量是研究或试验水平的一些特征:如研究设计、干预量、给药途径、疗程、患者的性别、年龄、研究样本量;也可以是单个研究内所包含病例的综合特征,如患者的平均年龄、平均身高等。但是不能将单个患者的身高、体重等指标作为Meta回归分析的协变量偏倚的识别与处理 偏性的估计 漏斗图(Funnel Plot)是以每个研究的效应值为横坐标,以每个研究的样本量或效应值方差的倒数为纵坐标做成的散点图。对处理效应的估计,其准确性是随样本含量的
15、增加而增加,小样本研究的效应估计值分布于图的底部,其分布范围较宽;大样本研究的效应估计值分布范围较窄,当没有发表偏倚时,其图形呈对称的倒漏斗状,故称之为“漏斗图” 六、结果评价和解释 结果的解释Meta分析结果除了要考虑是否有统计学意义外,还应结合专业知识判断结果有无临床意义。若结果仅有统计学意义,但合并效应量小于最小的有临床意义的差值时,结果不可取;若合并效应量有临床意义,但无统计学意义时,不能定论,需进一步收集资料。结果的推论在推广应用时,应结合该Meta分析的文献纳入/排除标准,考虑其样本的代表性,特别应注意研究对象特征及生物学或文化变异、地理区域、干预措施等方面是否与自己的具体条件一致。 Meta分析常用软件 RevMan STATA SAS等 RevMan录入比较方便,但是无法进行meta回归分析,SAS较STATA操作更复杂,而且STATA的图较美观,因此推荐使用STATA