第7讲多元线性回归3.ppt

上传人:p** 文档编号:572494 上传时间:2023-11-07 格式:PPT 页数:26 大小:432KB
下载 相关 举报
第7讲多元线性回归3.ppt_第1页
第1页 / 共26页
第7讲多元线性回归3.ppt_第2页
第2页 / 共26页
第7讲多元线性回归3.ppt_第3页
第3页 / 共26页
第7讲多元线性回归3.ppt_第4页
第4页 / 共26页
第7讲多元线性回归3.ppt_第5页
第5页 / 共26页
第7讲多元线性回归3.ppt_第6页
第6页 / 共26页
第7讲多元线性回归3.ppt_第7页
第7页 / 共26页
第7讲多元线性回归3.ppt_第8页
第8页 / 共26页
第7讲多元线性回归3.ppt_第9页
第9页 / 共26页
第7讲多元线性回归3.ppt_第10页
第10页 / 共26页
亲,该文档总共26页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第7讲多元线性回归3.ppt》由会员分享,可在线阅读,更多相关《第7讲多元线性回归3.ppt(26页珍藏版)》请在第壹文秘上搜索。

1、2023-11-71第七讲Multiple linear regression(3)2023-11-72例2.1 某精神病学医生想知道精神病患者经过个月治疗后疾病恢复的情况Y是否能通过精神错乱的程度X1、猜疑的程度X2两项指标来较为准确地预测。资料如下,试作分析。2023-11-73DATA d4p15;DATA d4p15;INPUT y x1 x2;INPUT y x1 x2;CARDS;CARDS;28 3.36 6.9 28 3.36 6.924 3.23 6.524 3.23 6.514 2.58 6.214 2.58 6.221 2.81 6.021 2.81 6.022 2.80

2、 6.422 2.80 6.410 2.74 8.410 2.74 8.428 2.90 5.628 2.90 5.6 8 2.63 6.9 8 2.63 6.923 3.15 6.516 2.60 6.313 2.70 6.922 3.08 6.320 3.04 6.821 3.56 8.813 2.74 7.118 2.78 7.2;2023-11-74PROC REG;PROC REG;MODEL y=x1 x2;MODEL y=x1 x2;RUN;RUN;以上是程序的参数估计结果,不难看出截距项可以上是程序的参数估计结果,不难看出截距项可以去掉。以去掉。2023-11-75DATA a

3、bc2;DATA abc2;SET D4P15;SET D4P15;PROC REG;PROC REG;MODEL y=x1 x2/NOINT P R;MODEL y=x1 x2/NOINT P R;RUN;RUN;将截距项去将截距项去掉掉计算各点上因计算各点上因变量的预测值变量的预测值进行残差分析进行残差分析2023-11-762023-11-77 这是程序的这是程序的方差分析方差分析和参数估计结果,方程与各和参数估计结果,方程与各参数的检验结果都有显著性意义,所求得的二元线性参数的检验结果都有显著性意义,所求得的二元线性回归方程为回归方程为:1217.8060564.873584Yxx线性

4、回归方程的估计标准误为:线性回归方程的估计标准误为:.2.53714Y xS2023-11-782023-11-79这是对程序中的二元回归模型作残差分析的结果这是对程序中的二元回归模型作残差分析的结果,从第、两列发现第个观测点所对应的学生,从第、两列发现第个观测点所对应的学生化残差的绝对值大于化残差的绝对值大于(因因STUDENT=-2.170)STUDENT=-2.170),故认,故认为该点可能是异常点,需认真检查核对原始数据。为该点可能是异常点,需认真检查核对原始数据。2023-11-710DATA abc3;SET D4P15;IF _N_=8 THEN DELETE;PROC REG;

5、MODEL y=x1 x2/NOINT P R;RUN;2023-11-7112023-11-712 这是程序的这是程序的方差分析方差分析和参数估计结果,方程与和参数估计结果,方程与各参数的检验结果都有显著性意义,所求得的二元各参数的检验结果都有显著性意义,所求得的二元线性回归方程为线性回归方程为 1216.9721584.465611Yxx线性回归方程的估计标准误为:线性回归方程的估计标准误为:.2.14515Y xS2023-11-7132023-11-714 比较第个观测点去掉前后预测平和比较第个观测点去掉前后预测平和PressPress的值的值从从122.8819122.8819降为降

6、为79.955079.9550;对整个方程检验的;对整个方程检验的F F值从值从474.661474.661上升为上升为660.326660.326;线性回归方程的估计标准线性回归方程的估计标准误由误由2.53714下降为下降为2.14515,表明该点对因变量预表明该点对因变量预测值的影响是比较大的测值的影响是比较大的,值得注意。值得注意。2023-11-715例例2.2有人在某地抽样调查了有人在某地抽样调查了29例儿童的血红例儿童的血红蛋白与种微量元素的含量,蛋白与种微量元素的含量,资料如下,试资料如下,试问问 可否用种微量元素可否用种微量元素(单位都是单位都是mol/L)钙钙(X1)、镁、

7、镁(X2)、铁、铁(X3)、铜铜(X4)来较好地预测来较好地预测血红蛋白血红蛋白(Y,g/L)的含量?的含量?SAS程序:DATA d4p16a;INPUT y x1-x4;CARDS;135.0 13.70 12.68 80.32 0.16.70.0 11.80 11.73 52.75 0.13;2023-11-716PROC reg;PROC reg;MODEL y=x1-x4/MODEL y=x1-x4/COLLINCOLLIN COLLINOINTCOLLINOINT;RUN;RUN;先用程序作试探性分析,并用了共线性诊断的技术。先用程序作试探性分析,并用了共线性诊断的技术。共线性诊断

8、选择共线性诊断选择项,对截距未进项,对截距未进行校正行校正共线性诊断选择共线性诊断选择项,对截距进行项,对截距进行校正校正2023-11-717输出结果及其解释输出结果及其解释2023-11-718程序的参数估计结果程序的参数估计结果 截距项、截距项、X2、X4都无显都无显著性意义,但不应过早将著性意义,但不应过早将X2、X4从模型中去掉。从模型中去掉。最好等截距项从模型中去掉之后,重新拟合,最好等截距项从模型中去掉之后,重新拟合,视最后的结果再作决定。视最后的结果再作决定。2023-11-719这是共线性诊断的第部分,即未对截距项校正的这是共线性诊断的第部分,即未对截距项校正的回归诊断结果回

9、归诊断结果 从最后一行的条件数从最后一行的条件数25.558510可知可知,自变量之间有较强的共线性自变量之间有较强的共线性;从该行方差分从该行方差分量的数值可看出量的数值可看出 自变量之间的共线性主要表现自变量之间的共线性主要表现在在X2、X3两变量上。两变量上。2023-11-720这是共线性诊断的第部分,即对截距项校正之后这是共线性诊断的第部分,即对截距项校正之后的回归诊断结果的回归诊断结果 因本例的截距项无显著性意义,因本例的截距项无显著性意义,故用第部分诊断结果就可以了。故用第部分诊断结果就可以了。2023-11-721data d4p16b;data d4p16b;set d4p1

10、6a;set d4p16a;PROC REG;PROC REG;MODEL y=x1-x4/NOINT SELECTION=STEPWISE MODEL y=x1-x4/NOINT SELECTION=STEPWISE SLE=0.30 SLS=0.10 STB;SLE=0.30 SLS=0.10 STB;RUN;RUN;用逐步回归法筛选自变量用逐步回归法筛选自变量变量进入方程变量进入方程的显著性水平的显著性水平剔除变量的显剔除变量的显著性水平著性水平求出标准化回求出标准化回归参数归参数2023-11-722Stepwise Procedure for Dependent Variable Y

11、Step 1 X3 EnteredR-square=0.98979882 C(p)=4.72240744Step 2 X1 EnteredR-square=0.99086912 C(p)=3.39412226Step 3 X4 EnteredR-square=0.99175444 C(p)=2.64104696Step 4 X4 Removed R-square=0.99086912 C(p)=3.39412226All variables in the model are significant at the 0.1000 level.No other variable met the 0.

12、3000 significance level for entry into the model.2023-11-723这是程序中逐步回归分析的扼要结果,详细结这是程序中逐步回归分析的扼要结果,详细结果省略了。果省略了。筛选的结果表明筛选的结果表明 X3是有非常显是有非常显著性影响的变量;而著性影响的变量;而X1仅在仅在P=0.0865水平上有水平上有显著性意义,若规定显著性意义,若规定SLS=0.05,则回归方程中,则回归方程中只有只有X3一个自变量。一个自变量。2023-11-7242023-11-725这是逐步回归分析的最后结果,回归方程为这是逐步回归分析的最后结果,回归方程为 两个标准

13、化回归系数分别为两个标准化回归系数分别为-0.174394-0.174394、1.1661841.166184,结合前面共线性诊断的结果可知,结合前面共线性诊断的结果可知,X1X1与与X3X3之间无密之间无密切的相关关系,故可认为切的相关关系,故可认为X3X3对对Y Y的影响大于的影响大于X1X1。131.2428061.813880Yxx 2023-11-726专业结论专业结论微量元素中铁微量元素中铁(X3)的含量对血红蛋白的含量对血红蛋白(Y)的影响的影响有非常显著性意义。有非常显著性意义。铁的吸收量提高后,有助于血红蛋白含量的提高铁的吸收量提高后,有助于血红蛋白含量的提高(因因B3=1.166);而钙的吸收量提高后,反而会使血红蛋白含量有而钙的吸收量提高后,反而会使血红蛋白含量有减少的趋势减少的趋势(因因B1=-0.174)。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 大学课件

copyright@ 2008-2023 1wenmi网站版权所有

经营许可证编号:宁ICP备2022001189号-1

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第壹文秘网,我们立即给予删除!