《临床研究中的误差和控制.ppt》由会员分享,可在线阅读,更多相关《临床研究中的误差和控制.ppt(77页珍藏版)》请在第壹文秘上搜索。
1、第五讲 临床研究中的误差和控制2主要内容概述偏倚的概念及分类临床研究中的常见偏倚偏倚的防止与处理3第一节 概述一、误差的概念及分类二、随机误差三、系统误差4一、误差的概念及分类一、误差的概念及分类在临床研究中,由于各种因素的影响,所造成实际在临床研究中,由于各种因素的影响,所造成实际观察值与真实值不相等,即为误差观察值与真实值不相等,即为误差(error)误差通常指研究中所获得的实际测量值与真实值之误差通常指研究中所获得的实际测量值与真实值之间的差异间的差异常见的误差有两种,一是随机误差常见的误差有两种,一是随机误差(random error),二是系统误差二是系统误差(systematic
2、error)这两种误差贯穿于这两种误差贯穿于临床流行病学研究的设计、实施、分析、推论的全临床流行病学研究的设计、实施、分析、推论的全过程过程5一、误差的概念及分类一、误差的概念及分类评价研究中用来反映是否存在误差及其影响程度的评价研究中用来反映是否存在误差及其影响程度的最常用指标就是真实性最常用指标就是真实性(validity)和可靠性和可靠性 (reliability),前者主要反映系统误差的大小,后者前者主要反映系统误差的大小,后者主要反映随机误差的大小主要反映随机误差的大小 真实性差 真实性好 真实性好 真实性差可靠性好 可靠性差 可靠性好 可靠性差6内部真实性内部真实性 / 外部真实性
3、外部真实性内部真实性内部真实性(internal validity): 从当前研究对象得到从当前研究对象得到的结果能否准确地反映目标的结果能否准确地反映目标/源人群的真实情况源人群的真实情况 外部真实性外部真实性(external validity /generalizability): 从当从当前研究对象得到的结果能否适用于目标人群以外的前研究对象得到的结果能否适用于目标人群以外的其他人群(外推性)其他人群(外推性)内部真实性是外部真实性的先决条件内部真实性是外部真实性的先决条件7内部真实性内部真实性 vs. 外部真实性外部真实性研究样本? 内部真实性内部真实性 目标/源人群疾病暴露+ +其
4、其他他人人群群? 外部真实性外部真实性 (外推性外推性)8二、随机误差二、随机误差 随机误差随机误差(random error),又称为机遇误差,又称为机遇误差(chance error),或称偶然误差,或称偶然误差(accidental error)由于研究对象常来自某个特定总体的样本,故样本由于研究对象常来自某个特定总体的样本,故样本与总体之间必然因被测定的生物学现象与总体之间必然因被测定的生物学现象(或指标或指标)的的随机变异,以及测量方法本身的随机变异等原因而随机变异,以及测量方法本身的随机变异等原因而存在一定的差别,从而导致实测值与真实值出现一存在一定的差别,从而导致实测值与真实值出
5、现一定差异,被称为定差异,被称为“随机误差随机误差”随机误差包括抽样误差和随机测量误差等随机误差包括抽样误差和随机测量误差等9二、随机误差二、随机误差在流行病学研究中,通常采用变异系数在流行病学研究中,通常采用变异系数(coefficient of variation, CV)和标准误和标准误( )来衡量随机误差或精来衡量随机误差或精度的高低度的高低表5-1 三个医生测定婴儿头尾结果的随机误差大小评价xs医生医生每次测量结果每次测量结果(cm)CV(%)甲甲39.7;40.1;40.9;41.31.800.36乙乙39.9;40.3;40.7;41.11.270.27丙丙39.9;40.1;4
6、0.3;40.4;40.6;40.8;40.9;41.00.970.14xs10三、系统误差三、系统误差 系统误差是指在调查或测量时,由于某种确切原因,系统误差是指在调查或测量时,由于某种确切原因,如实验方法不当、仪器不准等原因造成的,表现为如实验方法不当、仪器不准等原因造成的,表现为研究结果有规律的偏大或偏小研究结果有规律的偏大或偏小这种误差不能像随机误差那样可以用统计学方法去这种误差不能像随机误差那样可以用统计学方法去刻画和研究其规律性,并据此估计和控制其大小刻画和研究其规律性,并据此估计和控制其大小 11随机误差和系统误差的区别随机误差和系统误差的区别样本大小误差随机误差系统误差12随机
7、误差和系统误差的区别随机误差和系统误差的区别 项目项目随机误差随机误差系统误差系统误差产生原因产生原因个体生物学变异个体生物学变异研究方法的不同研究方法的不同测量方法本身的随机变测量方法本身的随机变异异 研究条件的不同研究条件的不同测量或观察方法不同测量或观察方法不同偶然因素偶然因素 测量工具的不同测量工具的不同人为因素人为因素大小和方向大小和方向无固定的大小和方向无固定的大小和方向有固定的大小和方向有固定的大小和方向分布分布正态分布正态分布偏态或呈线性分布偏态或呈线性分布是否可消除是否可消除否否是是增加样本量的作用增加样本量的作用降低降低没有作用没有作用评价指标评价指标可靠性或精确度可靠性或
8、精确度 真实性真实性表5-2 随机误差和系统误差的区别随机误差和系统误差的区别 13第二节第二节 偏倚的概念及分类偏倚的概念及分类 一、偏倚的概念一、偏倚的概念二、偏倚的分类二、偏倚的分类 14一、偏倚的概念偏倚偏倚(bias)是指在医学研究中的各个环节,包括研是指在医学研究中的各个环节,包括研究设计、实施、分析和推断过程中存在的系统误差究设计、实施、分析和推断过程中存在的系统误差以及结果解释和推论中的片面性,使得研究结果与以及结果解释和推论中的片面性,使得研究结果与真实值出现的倾向性差异真实值出现的倾向性差异偏倚是影响医学研究结果真实性的主要因素,它可偏倚是影响医学研究结果真实性的主要因素,
9、它可能夸大或者缩小真实效应,从而导致研究因素与研能夸大或者缩小真实效应,从而导致研究因素与研究结局间的关联强度高于或低于真实的关联,偏倚究结局间的关联强度高于或低于真实的关联,偏倚是有方向性的是有方向性的 15一、偏倚的概念假定某效应真实值为假定某效应真实值为 ,样本观察值为,样本观察值为 偏倚的方向偏倚的方向正偏倚(高估): 负偏倚(低估): 趋于零效应值: 1 远离零效应值: 1 颠倒偏倚: 1, 1 或 1 偏倚的大小偏倚的大小 RRRRRR16二、偏倚的分类 选择偏倚选择偏倚信息偏倚信息偏倚混杂偏倚混杂偏倚 17(一一) 选择偏倚选择偏倚(selection bias) 主要发生在研究
10、设计阶段主要发生在研究设计阶段当按一定的条件识别研究对象时,从所纳入的研究当按一定的条件识别研究对象时,从所纳入的研究对象中获得的有关因素与疾病的联系系统地偏离了对象中获得的有关因素与疾病的联系系统地偏离了原人群中该因素与疾病之间的真实联系,即认为有原人群中该因素与疾病之间的真实联系,即认为有选择偏倚存在选择偏倚存在究其原因主要是被选入到研究中的对象与没有被选究其原因主要是被选入到研究中的对象与没有被选入者在与暴露或疾病有关的特征上的差异所造成的入者在与暴露或疾病有关的特征上的差异所造成的系统误差系统误差18(一一) 选择偏倚选择偏倚(selection bias)表5-3 更年期服用雌激素与
11、子宫内膜癌间的关系雌激素雌激素服用史服用史肿瘤科肿瘤科妇科妇科患者患者(%)非患者非患者(%)合计合计患者患者(%)非患者非患者(%)合计合计有有45(62.5)7(6.0)5259(39.9)42(28.4)101无无72(37.5)110(94.0)18289(60.1)106(71.6)195合计合计117117234148148296OR9.82(95%CI:4.20, 22.98)1.67(95%CI:1.03, 2.72) 在同一个医院的肿瘤科和妇科分别选择研究对象,其研究结果却存在很大的差异?19(一一) 选择偏倚选择偏倚(selection bias)在肿瘤科,这些患者服用雌激
12、素后出现子宫出血症在肿瘤科,这些患者服用雌激素后出现子宫出血症状而会到医院就诊,从而能发现人群中的子宫内膜状而会到医院就诊,从而能发现人群中的子宫内膜癌病人,且多为早期病人;而不服用者,无出血症癌病人,且多为早期病人;而不服用者,无出血症状,从而不易及早被诊断出来,因而能得出两者之状,从而不易及早被诊断出来,因而能得出两者之间较强关联的结论间较强关联的结论在妇科,这些患者多数接受常规妇科检查,一般不在妇科,这些患者多数接受常规妇科检查,一般不会考虑到肿瘤的影响,该科病人可能多为中晚期的会考虑到肿瘤的影响,该科病人可能多为中晚期的子宫内膜癌患者子宫内膜癌患者主要是所选病人处在疾病的不同时期所致主
13、要是所选病人处在疾病的不同时期所致20(二二) 信息偏倚信息偏倚(information bias)在获取暴露、结局或其他信息时所出现的系统误差或在获取暴露、结局或其他信息时所出现的系统误差或偏差叫信息偏倚。信息偏倚又称为错分偏倚偏差叫信息偏倚。信息偏倚又称为错分偏倚(misclassification bias)来源来源:研究者、调查对象、测量工具、原始记录不准:研究者、调查对象、测量工具、原始记录不准信息偏倚信息偏倚:同等发生于暴露组和非暴露组非特异性:同等发生于暴露组和非暴露组非特异性错分错分OR、RR1信息偏倚信息偏倚:不同等发生于暴露组和非暴露组特异性:不同等发生于暴露组和非暴露组特
14、异性错分错分OR、RR 或高或低或高或低21(二二) 信息偏倚信息偏倚(information bias)表5-4 孕妇腹部X线暴露与小儿白血病间的关系X线暴露史线暴露史病例组病例组对照组对照组合计合计OR有有72(a)58(b)130(m1)1.34(0.88-2.04) 无无179 (c)193(d)372(m2)合计合计251(n1)251(n2)502(N)表5-5 不同方法获得的孕妇腹部X线照射史的比较医院记录医院记录孕妇回忆孕妇回忆合计合计有有无无不清楚不清楚有有2410337无无231538合计合计264187522(三三) 混杂偏倚混杂偏倚(confounding bias)
15、既与疾病有制约关系,又与所研究的暴露因素有联既与疾病有制约关系,又与所研究的暴露因素有联系的外来因素的影响,掩盖或夸大了所研究的暴露系的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系,叫混杂偏倚;这种外来因素称因素与疾病的联系,叫混杂偏倚;这种外来因素称为混杂因素为混杂因素混杂因素的条件混杂因素的条件必须是所研究疾病的危险因素之一必须是所研究疾病的危险因素之一 必须与所研究的暴露因素有关必须与所研究的暴露因素有关 必须不是研究因素与疾病病因链上的中间环节必须不是研究因素与疾病病因链上的中间环节23(三三) 混杂偏倚混杂偏倚(confounding bias)出生序次出生序次 图5-1
16、 出生序次与Downs综合征患病率的关系 Downs综合征患者数综合征患者数/1000活产活产24(三三) 混杂偏倚混杂偏倚(confounding bias)产妇分娩年龄产妇分娩年龄 ( (岁岁) )图5-2 产妇分娩年龄与Downs综合征患病率的关系Downs综合征患者数综合征患者数/1000活产活产25三大类偏倚选择偏倚存在吗?在队列研究中,暴露组和非暴露组中的参加者除了暴露因素外,在所有在队列研究中,暴露组和非暴露组中的参加者除了暴露因素外,在所有其他的重要方面类似(可比)吗?其他的重要方面类似(可比)吗?在病例在病例-对照研究中,病例组和对照组除了所研究的疾病外,在其他的所对照研究中,病例组和对照组除了所研究的疾病外,在其他的所有重要方面类似(可比)吗?有重要方面类似(可比)吗?信息偏倚存在吗?在队列研究中,暴露组和非暴露组是用同样的方法获得有关结局的信息在队列研究中,暴露组和非暴露组是用同样的方法获得有关结局的信息吗?吗?在病例在病例-对照研究中,病例组和对照组是用同样的方法获得关于暴露因素对照研究中,病例组和对照组是用同样的方法获得关于暴露因素的信息吗?的信息吗?表5-6