生存分析统计学.ppt

上传人:p** 文档编号:182491 上传时间:2023-03-29 格式:PPT 页数:78 大小:2.07MB
下载 相关 举报
生存分析统计学.ppt_第1页
第1页 / 共78页
生存分析统计学.ppt_第2页
第2页 / 共78页
生存分析统计学.ppt_第3页
第3页 / 共78页
生存分析统计学.ppt_第4页
第4页 / 共78页
生存分析统计学.ppt_第5页
第5页 / 共78页
生存分析统计学.ppt_第6页
第6页 / 共78页
生存分析统计学.ppt_第7页
第7页 / 共78页
生存分析统计学.ppt_第8页
第8页 / 共78页
生存分析统计学.ppt_第9页
第9页 / 共78页
生存分析统计学.ppt_第10页
第10页 / 共78页
亲,该文档总共78页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《生存分析统计学.ppt》由会员分享,可在线阅读,更多相关《生存分析统计学.ppt(78页珍藏版)》请在第壹文秘上搜索。

1、复复 习习 LogisticLogistic回归模型是一种概率模型,适合于病例对照研究、随访研究和横断面研究,且结果发生的变量取值必须是二分的或多项分类的。 可用影响结果变量发生的因素为自变量与因变量建立回归方程。复复 习习 1. Logistic回归分析的数据结构 2. Logistic回归分析的模型 3. 筛选变量的常用方法 4. Logistic回归分析的结果解释目的:目的:作出以多个自变量(影响因素)估计应变量(结果变量)的logistic回归方程资料:资料:1. 应变量为反映某现象发生与不发生的二值变量;2. 自变量(影响因素)可能是二值数据或等级资料或计量资料。分类变量要数量化用途

2、:用途:研究某种疾病或现象发生和多个危险因素(或保护因子)的数量关系1. Logistic1. Logistic回归模型的数据结构 设资料中有一个因变量Y、p个自变量X1, X2,Xp,对每个实验对象共有n次观测结果,可将原始资料列成表1形式。 表1. LogisticLogistic回归模型的数据结构实验对象 Y X1 X2 X3 . XP 1 Y1 a11 a12 a13 a1p 2 Y2 a21 a22 a23 a2p 3 Y3 a31 a32 a33 a3p n Yn an1 an2 an3 anp 其中:Y取值是二值或多项分类5 表2. 肺癌与危险因素的调查分析例号 是否患病 性别

3、吸烟 年龄 地区 1 0 1 0 30 0 2 0 0 1 46 1 3 1 0 0 35 1 30 1 0 0 26 1 是否患病:1代表否, 0代表是 性 别:1代表男, 0代表女 吸 烟:1代表吸烟,0代表不吸烟 地 区:1代表农村,0代表城市 表3. 配对资料(1:1)对子号 病例 对照 X1 X2 X3 X1 X2 X3 1 1 3 0 1 0 1 2 0 3 1 1 3 0 3 0 1 2 0 2 0 10 2 2 2 0 0 0注:X1蛋白质摄入量,取值:0,1,2,3 X2不良饮食习惯,取值:0,1,2,3 X3 精 神 状 况,取值:0,1,2 2 2、 LogisticLo

4、gistic回归模型回归模型 令: Y=1 发病(阳性、死亡、治愈等) Y=0 未发病(阴性、生存、未治愈等) 将发病(Y=1)的概率记为P,它与自变量x1, x2,xp之间的Logistic回归模型为: )exp(1)exp(110110ppppXXXXP ppXXPP 110)1/(ln定义:为Logistic变换,即: )1/(ln)(PPPLogitppXXPLogit 110)(2.Logistic2.Logistic回归的模型回归的模型3.3.筛选变量的常用方法筛选变量的常用方法 向前法(forward selection) 后退法(backward selection) 逐步回归

5、法(stepwise selection)Variables in the Equation.143.0479.3881.0021.1541.0531.265-6.0431.9669.4481.002.0023.0211.3754.8301.02820.5051.386303.296.149.0547.7201.0051.1611.0451.289-7.4032.5228.6151.003.001X3ConstantStep1aX2X3ConstantStep2bBS.E.WalddfSig.Exp(B)LowerUpper95.0% C.I.for EXP(B)Variable(s) ent

6、ered on step 1: X3.a. Variable(s) entered on step 2: X2.b. 4.Logistic4.Logistic回归的结果解释回归的结果解释4.Logistic4.Logistic回归的结果解释回归的结果解释 设第i个因素的回归系数为bi,表示当有多个自变量存在时,其它自变量固定不变的情况下,自变量Xi每增加一个单位时,所得到的优势比的自然对数。也就是其它自变量固定不变的情况下,自变量Xi每增加一个单位时,影响因变量Y=0发生的倍数 设第i个因素的回归系数为bi 当bi0时,对应的优势比ORi=exp(bi)1,说明该因素是危险因素; 当bi0时,

7、对应的优势比ORi=exp(bi)4)=P1=32/35=0.914286第二行的生存率S(T5)=P1P2=32/3530/32=0.8571437.计算各生存率的标准误。说明抽样误差的大小,式中n为样本含量,i为秩次, 编秩编秩(1)生 存 月生 存 月数数(2)期 初 病期 初 病例数例数(3)死 亡 例死 亡 例数数(4)死 亡 概死 亡 概率率(5)生 存 概生 存 概率率(6)生 存 率生 存 率(7)生存率标生存率标准误准误(8)1-343533/3532/350.9142860.0473184-553222/3230/320.059149683011/3029/300.8285

8、710.0637057-992933/2926/290.7428570.07387610102611/2625/260.7142860.07636011112511/2524/250.6857140.07846912-14122433/2421/240.6000000.0828081512+2100/2121/210.6000000.08280816132011/2019/200.5700000.08392617141911/1918/190.5400000.08470118-19161822/1816/180.4800000.08525620171611/1615/160.4500000.0

9、85042表表8.Kaplan-meier法计算生存率法计算生存率0.857143如第二行和第九行如第二行和第九行 有截尾值时(有截尾值时(12+12+),计算),计算sp(T13)sp(T13)时不累计时不累计1/(n-1/(n-15)(n-15+1)15)(n-15+1)0591485. 0) 1535)(535(1.) 1235)(235(1) 1135)(135(18571429. 0)5(2/1Tsp0839260. 0) 11635)(1635(1) 11435)(1435(1.) 1235)(235(1) 1135)(135(15700000. 0)13(2/1Tsp编秩编秩(1

10、)生 存 月生 存 月数数(2)期 初 病期 初 病例数例数(3)死 亡 例死 亡 例数数(4)死 亡 概死 亡 概率率(5)生 存 概生 存 概率率(6)生 存 率生 存 率(7)生存率标生存率标准误准误(8)1-343533/3532/350.9142860.0473184-553222/3230/320.059149683011/3029/300.8285710.0637057-992933/2926/290.7428570.07387610102611/2625/260.7142860.07636011112511/2524/250.6857140.07846912-14122433/

11、2421/240.6000000.0828081512+2100/2121/210.6000000.08280816132011/2019/200.5700000.08392617141911/1918/190.5400000.08470118-19161822/1816/180.4800000.08525620171611/1615/160.4500000.085042表表8.Kaplan-meier法计算生存率法计算生存率0.857143编 秩编 秩(1)(1)生存月生存月数数(2)(2)期初病期初病例数例数(3)(3)死亡例死亡例数数(4)(4)死 亡死 亡概 率概 率(5)(5)生存概

12、生存概率率(6)(6)生 存 率生 存 率(7)(7)生 存 率生 存 率标 准 误标 准 误(8)(8)2121191915151 11/151/1514/1514/150.4200000.4200000.0844980.08449822-2322-23202014142 22/142/1412/1412/140.3600000.3600000.0823930.0823932424222212121 11/121/1211/1211/120.3300000.3300000.0808040.080804252523+23+11110 00/110/1111/1111/110.3300000.3

13、300000.0808040.0808042626242410101 11/101/109/109/100.2970000.2970000.0791760.079176272724+24+9 90 00/90/99/99/90.2970000.2970000.0791760.07917628-2928-2926268 82 22/82/86/86/80.2227500.2227500.0747900.074790303030+30+6 60 00/60/66/66/60.2227500.2227500.0747900.074790313132325 51 11/51/54/54/50.1782

14、000.1782000.0718860.071886212136364 41 11/41/43/43/40.1336500.1336500.0662970.06629733-3533-3536+36+3 30 00/30/33/33/30.1336500.1336500.0662970.066297PjPj小样本生存分析小样本生存分析 Kaplan-MeierKaplan-Meier方法在方法在SPSSSPSS中的实现中的实现生存状态:生存状态:1 1死亡,死亡,0 0截尾截尾SPSS SPSS 软件实现方法软件实现方法 FileOpenFileOpen相应数据文件相应数据文件 Analyze

15、 SurvivalKaplan-Meier Analyze SurvivalKaplan-Meier Time(Time(时间时间)Status Define event )Status Define event single value(1) Continue OKsingle value(1) Continue OK6365M Me ea an ns s a an nd d M Me ed di ia an ns s f fo or r S Su ur rv vi iv va al l T Ti im me e246.66775.00699.654393.679133.00043.2744

16、8.182217.818EstimateStd. ErrorLower BoundUpper Bound95% Confidence IntervalEstimateStd. ErrorLower BoundUpper Bound95% Confidence IntervalMeanaMedianEstimation is limited to the largest survival time if it is censored.a. 2.2.寿命表法寿命表法(Life table methodLife table method) 简称LT法。 基本思想:基本思想:随访时间划分成若干个时间区间,t时刻的生存率为t时刻前各时间区间生存概率的乘积。 应用条件:应用条件:数据已总结成若干时段的频数表形式,或样本量较大。 例1:某临床试验对20名第III或第IV期黑色素瘤的患者进行随访研究,截至研究期结束,记录的生存资料见下表,试计算100周的生存率。(大样本)(大样本)2.2.寿命表法寿命表法(Life table methodLife table method)表表1. 201. 20名

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 统计学

copyright@ 2008-2023 1wenmi网站版权所有

经营许可证编号:宁ICP备2022001189号-1

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第壹文秘网,我们立即给予删除!