《第15章回归分析预测——讨论双变量及多变量预测.ppt》由会员分享,可在线阅读,更多相关《第15章回归分析预测——讨论双变量及多变量预测.ppt(16页珍藏版)》请在第壹文秘上搜索。
1、第十一章 回归分析预测法n回归分析法又叫因果分析法,利用预测目标(因变量)与影响因素(自变量)之间的相关关系,通过建立回归模型,由影响因素的数值推算预测目标的数值。分为一元、多元回归,线性、非线性回归。第一节 回归分析法的预测步骤n一、确立预测目标和影响因素n决策目标预测具体目标因变量;n市场调查/查阅资料自变量。n二、进行相关分析n自变量和因变量之间存在显著的相关性是进行回归分析的基础。相关分析包括:n定性分析定性分析:观察因变量与自变量之间变化趋势关系十分密切相关联;n定量分析定量分析:计算变量间相关系数,决定相关程度。n三、建立回归模型n根据自变量和因变量资料建立回归模型;n四、回归模型
2、的检验n回归系数只有在与零有明显差别的情况下,用回归模型进行预测才有意义。同时排除自相关。n五、进行实际预测n依据经过分析和检验的回归预测模型,进行实际预测,并对于此结果进行综合分析。第二节 一元线性回归分析预测法n如果因变量(y)与某一个主要影响因素(自变量x)之间存在较为密切的线性相关关系,则可用一元线性回归模型来描述它们之间的数量关系。yabxa,b为模型参数(回归系数),a为回归直线的截距,b为回归直线的斜率。参数通常采用最小二乘法估计。aybxiiii22inbniyyxxxx n例:某食品批发站,发现随着成年人口数量的增加,啤酒销售数量也在相应增加,以往几年的统计资料如表:1989
3、199019911992199319941995199619971998啤酒销量(万箱)28315053617060666365新增成年人口(万人)25283438476245565455根据以上资料,要根据新增加成年人口数预测未来几年啤酒的销售趋势和数量。n步骤一:进行线性相关分析n步骤二:建立回归方程n步骤三:进行预测n步骤四:对预测值置信区间进行估计步骤一:进行线性相关分析定性分析:x和y具有相似/相同的发展趋势n定量分析:计算相关系数。选择要预测的啤酒销量作为因变量y,给定的新增成年人口数量为自变量x,二者之间的相关程度可以用线性相关系数来确定:ii22iixx yyrrx y x y
4、xxyy (1),为,历年平均数iiii2222iiiinx yxyr=nxxnyy相关系数计算表序号年份1198928257006257842199031288687849613199150341700115625004199253382014144428095199361472867220937216199470624340384449007199560452700202536008199666563696313643569199763543402291639691019986555357530254225547444258622116431825iyixiix y2ix2iyiiii22
5、2222iiiinx yxy10 25862444 547r=0.94810 2116444410 31825547nxxnyyn相关系数为0.948说明新增成年人口数与啤酒销量之间正线性关系程度很高。但其可靠程度如何,还必须进行相关系数检验:n(1)选择限制性水平(检验水平,误差水平)n(2)根据 值和(n-2),查得相关系数临界值(P371)。对 n 和(n-2)=8,查得临界值记为 n(3)比较r与rc,如果 ,表明自变量与因变量的线性相关关系具有显著性,有 的可靠程度,可适用于预测。5%10%或者5%crr1 BACK6320.0)8(05.0 rrc除此之外,还有T检验和F检验,主要
6、检验回归系数b是否显著不为为0步骤二:建立回归方程n根据公式计算出参数a、b。547444aybx=1.105.861010iiii222in10 25862547 444b1.1010 21164444niyyxxxx y5.86 1.10 x一元线性回归预测模型:BACK步骤三:进行预测n将今后每年新增成年人口数分别代入回归预测模型中,就能得到每年啤酒销售量的预测值。如预计1999年新增成年人口57万,则该年销售啤酒的数量预测值为:1999 y5.86 1.10 5768.6(万箱)BACK步骤四:对预测值置信区间进行估计n实际值往往并不一定会落在回归趋势线上,而是在趋势线上下一定范围内。
7、因此需要将y实际值可能的取值范围即置信区间进行分析。n1.计算预测值的回归标准误差n2.正态分布下,预测值的范围:2iiyySnkyS 68.3%置信度y2S 95%置信度y3S 99%置信度n1282533.3628.72962312836.6632.03563503443.2645.42764533847.6628.51655614757.5611.83366706274.0616.48367604555.3621.52968665667.462.13169635465.265.107610655566.361.8496193.644置信区间计算表置信区间计算表iyixi y2iiy-y2iiyy193.644S4.9199nk102n当x=57万人时,y=68.6万箱,利用2S原则计算置信区间,置信区间为y2S,即在(58.878.3)万箱内,置信度95%。n注意:回归预测模型不能一劳永逸,需要根据事物随时间发展变化的情况,重新更新确立新的模型。