《方积乾卫生统计学研究设计概论1209.ppt》由会员分享,可在线阅读,更多相关《方积乾卫生统计学研究设计概论1209.ppt(46页珍藏版)》请在第壹文秘上搜索。
1、第十三章 医学研究的统计学设计医学研究医学研究 干预性研究(Interventional study)实验研究(Experiment)临床试验(Clinical trial)观察性研究(Observational study)2医学研究的设计医学研究的设计专业设计:从专业角度考虑选题、研究对象和技术方法统计学设计:对象、因素、指标、研究类型、统计方法、样本量估算 3第一节 研究设计的基本要素 研究概况 研究对象 研究因素 结局指标 调查表5 5一、研究假说 科学研究的假说:根据已有知识作出假定性的说明和推断,有待研究予以验证。例如,关于初次分娩的主动管理政策的假说:(1)可减少剖腹产的比例;(
2、2)可减少延长分娩时间的比例;(3)并不影响产妇对分娩过程的满意度。5二、研究对象n “Eligibility criteria”:年龄、性别、临床诊断、病情n “Exclusion criteria”:常为保障病人安全。例如,一项有关HIV感染的临床治疗研究。n 纳入标准:符合HIV治疗指导原则;年满18岁的成年人;开始治疗时BMI 18.5。n 排除标准:怀孕期和哺乳期的妇女。6三、研究因素影响结局的内外因素影响结局的内外因素n研究因素研究因素:实验性研究,施加于研究对象的外界干预,也称为处理(treatment)因素;观察性研究,因素是自然存在的,如暴露(exposure)因素、危险 (
3、risk)因素。n非研究因素非研究因素:混杂因素或协变量,应予控制。动物实验:窝别、年龄、体重、营养等;临床疗效研究:疾病分期、病理类型等。7四、结局指标结局指标结局指标(outcome,end point)度量研究因素产生的:效应(effect)或反应(response)n 主要指标(primary outcome)和次要指标(secondary outcome)n 客观指标和主观指标准确度(accuracy)、精密度(precision)灵敏度(sensitivity)、特异度(specificity)8五、调查表调查表调查表(form)问卷问卷(questionnaire)量表量表(sc
4、ale)病例报告表(case report form,CRF)生存质量(quality of life,QOL)测定量表 一份量表含若干领域(domain)一个领域含若干方面(facet)一个方面含若干条目(item)9量表的考评n 效度(validity)有效性和正确性 量表确实测定了所要测定的特征?客观真实性的程度?n 信度(reliability)可靠性 稳定性 一致性n 可接受性(acceptability)被测定者对量表的接受程度10第二节 统计设计的基本原则 对照(Control)随机(Randomization)重复(Repeat)样本含量的估算1212一、对照(Control)
5、医学研究多数是通过比较产生结论,对照是比较的基础 1消除非研究因素的混杂 2鉴别研究因素的效应和自然发展结果 12实验的三要素 (1)受试对象受试对象 纳入标准和排除标准 (2)实验因素实验因素(干预因素)控制重要的非实验因素(其他)(3)实验效应实验效应 但测得的是实验效应与其他效应之和干预因素干预因素对象对象效应效应其他其他其他效应其他效应13例:相互对照 为比较为比较A与与B:其他干预 A对象1干预A效应其他效应其他干预 B对象2干预B效应其他效应14二、随机(Randomization)n 降低系统误差的影响,贯穿于设计和实施全过程:降低系统误差的影响,贯穿于设计和实施全过程:1.样本
6、代表性 总体中任何一个个体都有同等的机会进入样本;2.组间可比性 样本中任何一个个体都有同等机会被分配到任何一个组;3.排除实验顺序影响 样本中的任何一个个体先后接受处理的机会相同。n 随机化分组:随机化分组:使实验组与对照组在非实验因素的分布方面尽量保持均衡一致。15随机化方法n随机数字表(random number)n计算机伪随机数(pseudo random number)发生器 可重复n为保证实验的可靠性和可重复性,在实验设计中所用的随机化方法、随机数及产生随机数的程序、种子数等均应有记录(备查)16常用随机抽样方法(概率抽样)常用随机抽样方法(概率抽样)简单随机抽样简单随机抽样 系统
7、抽样系统抽样 整群抽样整群抽样 分层抽样分层抽样1.1.单纯随机抽样单纯随机抽样(simple random sampling)优点优点:均数、率及其标准误计算简便。:均数、率及其标准误计算简便。简便易行,适用小样本。简便易行,适用小样本。缺点缺点:当总体中例数多时,对观察单位进行编号不易操作,:当总体中例数多时,对观察单位进行编号不易操作,在实际工作中有时难以实现。在实际工作中有时难以实现。方法方法:抽签,用随机数字表和随机排列表,用计算机。:抽签,用随机数字表和随机排列表,用计算机。例例14-5 14-5 抽样参加夏令营活动,某班有学生抽样参加夏令营活动,某班有学生100100人,若抽取为
8、人,若抽取为1010人参加夏令营,试作单纯随机抽样设计。人参加夏令营,试作单纯随机抽样设计。2.2.系统抽样(系统抽样(systematic sampling)例例14.6 14.6 欲调查某社区贫血患病情况欲调查某社区贫血患病情况,该社区有居民该社区有居民10001000人人,试按试按系统抽样方法系统抽样方法,抽取例数为抽取例数为100100的样本的样本.先将先将10001000名居民按某一特征的顺序编号名居民按某一特征的顺序编号,N N为为1000,1000,n n=100,=100,抽样抽样间隔间隔1000/100=10,1000/100=10,在在110110之间随机确定一个数字之间随
9、机确定一个数字,譬如譬如7,7,每间隔每间隔1010个观察单位抽取一个个观察单位抽取一个,即即7 7、1717、2727、997997组成样本。组成样本。系统抽样系统抽样优点优点1 1)易于理解,简便易行;)易于理解,简便易行;2 2)容易得到一个按比例分配的样)容易得到一个按比例分配的样本;本;3 3)样本观察单位在总体中分布均匀,其抽样误差一般)样本观察单位在总体中分布均匀,其抽样误差一般小于单纯随机抽机抽样。小于单纯随机抽机抽样。缺点缺点1 1)当总体的观察单位按顺序有周期趋势或单调增(减)趋)当总体的观察单位按顺序有周期趋势或单调增(减)趋势时,容易产生明显的系统误差(偏倚);势时,容
10、易产生明显的系统误差(偏倚);2 2)在实际工作中,一般按单纯随机抽样方法估计其抽样误)在实际工作中,一般按单纯随机抽样方法估计其抽样误差,但系统抽样抽取各个观察单位并不是彼此独立的,因此差,但系统抽样抽取各个观察单位并不是彼此独立的,因此抽样误差的估计只是近似的。抽样误差的估计只是近似的。3.3.整群抽样整群抽样(cluster sampling)先将总体按照某种与研究无关的特征划分为先将总体按照某种与研究无关的特征划分为K K个个“群群”组,组,每个群组包括若干观察单位,然后抽取每个群组包括若干观察单位,然后抽取k k个个“群群”,抽取的,抽取的各个群的全部观察单位组成样本。各个群的全部观
11、察单位组成样本。优点优点:便于组织、节省经费,容易控制调查质量。便于组织、节省经费,容易控制调查质量。缺点缺点:当样本含量一定时,其抽样误差一般大于单纯随机:当样本含量一定时,其抽样误差一般大于单纯随机抽样,这是因为样本观察单位不是均匀散布在总体中。抽样,这是因为样本观察单位不是均匀散布在总体中。为降低抽样误差,可采用增加抽取的为降低抽样误差,可采用增加抽取的“群群”数,减少数,减少“群群”内观察单位数的方法进行抽样,即重新划分内观察单位数的方法进行抽样,即重新划分“群群”,使每,使每个个“群群”更小。更小。4.分层抽样(分层抽样(stratified sampling)先按对观察指标影响较大
12、的某种特征,将总体分为若干先按对观察指标影响较大的某种特征,将总体分为若干类别,再从每一层内随机抽取一定数量的观察单位,合起类别,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。来组成样本。优点优点A A:抽样误差小于前三种,样本的代表性好:抽样误差小于前三种,样本的代表性好B B:便于对不同层采用不同的抽样方法:便于对不同层采用不同的抽样方法C C:便于对各层独立进行分析:便于对各层独立进行分析 在实际调查研究中常常将两种或几种抽样方法结合起来在实际调查研究中常常将两种或几种抽样方法结合起来使用。使用。各抽样方法的抽样误差一般是:各抽样方法的抽样误差一般是:整整群抽样群抽样 简简单随
13、机单随机抽样抽样 系系统抽样统抽样 分分层抽样层抽样 (增加学分增加学分)样本含量的估计的目的是在保证一定精度和检验效能样本含量的估计的目的是在保证一定精度和检验效能的前提下,确定最少的观察单位数。的前提下,确定最少的观察单位数。从抽取样本的方式分从抽取样本的方式分 概率抽样概率抽样(单纯随机抽样、系统抽样、分层抽样、整群抽样单纯随机抽样、系统抽样、分层抽样、整群抽样)非概率抽样非概率抽样(偶遇抽样、判断抽样、定额抽样、雪球抽样偶遇抽样、判断抽样、定额抽样、雪球抽样)三、重复(Repeat)重复实验重复实验、重复取样重复取样、重复测量重复测量n在大量重复实验的条件下,该处理的真实效应才会比较真
14、实地显露出来n实验组和对照组的实验单位应具有一定的数量 样本含量n与重复实验相比,重复取样和重复测量属于第二位25四、样本含量的估算n比较两组测定值的均数n比较两组发生某结局的百分比比较两组测定值的均数比较两组测定值的均数(1)预计欲比较的两总体参数的差值预计欲比较的两总体参数的差值 (2)预计总体标准差预计总体标准差 (3)允许出现假阳性结果的机会允许出现假阳性结果的机会 (4)允许出现假阴性结果的机会允许出现假阴性结果的机会 单组比较:单组比较:两组比较:两组比较:22/)(ZZN22/)(2ZZN27例:格列美脲、例:格列美脲、格列苯脲对比研究格列苯脲对比研究(HbA1c)(1)欲检出欲
15、检出HbA1c临床差异临床差异0.65%(2)假定标准差为假定标准差为1.3%(3)双侧检验水平双侧检验水平0.05(4)功效功效80%退出率退出率20%(文中:文中:152例例)8.156%8044.12544.12565.03.1)84.096.1(465.03.1)84.096.1(4)(4 2222/ZZN28比较两组发生某结局的百分比比较两组发生某结局的百分比(1)预计一个组发生某结局的百分比约为预计一个组发生某结局的百分比约为 1(2)预计另一组发生某结局的百分比约为预计另一组发生某结局的百分比约为 2(3)允许犯假阳性错误的机会允许犯假阳性错误的机会(4)允许犯假阴性错误的机会允
16、许犯假阴性错误的机会 221c22122112/)1(2)1(2)1(2ZZNcc29例:格列美脲、例:格列美脲、格列苯脲对比研究(格列苯脲对比研究(HbA1c 达标达标)(1)预计一个组发生某结局的百分比约为预计一个组发生某结局的百分比约为45%(2)预计另一组发生某结局的百分比约为预计另一组发生某结局的百分比约为25%(3)允许犯假阳性错误的机会允许犯假阳性错误的机会 =5%(4)允许犯假阴性错误的机会允许犯假阴性错误的机会 =20%17620.07835.08697.1 25.045.0)45.01(45.02)25.01(25.0284.0)35.01(35.096.12 25.045.0)45.01(45.02)25.01(25.0284.0)35.01(35.096.12 )1(2)1(2)1(222222122112/ZZNcc30第三节 误差控制 误差来源 偏倚的控制3232一、误差来源n抽样误差抽样误差 不可避免,但有一定规律,利用统计学技术,不仅可以控制,还可估计其大小。n非抽样误差非抽样误差 1.过失误差 2.系统误差 又称偏倚(bias)(1)选择偏倚(sele