《商务统计学Ch13.ppt》由会员分享,可在线阅读,更多相关《商务统计学Ch13.ppt(45页珍藏版)》请在第壹文秘上搜索。
1、Chap 13-1第第13章章多元回归商务统计学(第5版).Chap 13-2学习目标在本章,你将学到在本章,你将学到: n如何建立多元回归模型n如何对回归系数进行解释n如何确定哪些自变量应该纳入模型n如何确定哪些自变量在预测因变量时是比较重要的n如何在回归模型中使用属性变量.Chap 13-3多元回归模型想法: 检查一个因变量(Y)与两个或多个自变量(Xi)之间的线性关系ikik2i21i10iXXXY 有有k个自变量的多元回归模型:个自变量的多元回归模型:Y轴截距总体斜率随机误差.Chap 13-4多元回归方程利用样本数据估计多元回归模型的系数kik2i21i10iXbXbXbbY Y的估
2、计值(或预测值)估计出的斜率系数k 个自变量的多元回归方程个自变量的多元回归方程:估计出的截距在本章中,我们将利用Excel或者Minitab来得到回归斜率系数以及其他回归指标.Chap 13-5两个自变量的模型两个自变量的模型YX1X222110XbXbbY自变量 X1的斜率自变量 X2的斜率多元回归方程(续).Chap 13-6例: 2个自变量n一个冰冻甜点馅饼的经销商想要评估影响需求的因素n因变量: 馅饼销售量 (单位:每周)n自变量: 价格 (美元) 广告费用(100美元)n收集了15周的数据.Chap 13-7销售馅饼的例子销售量 = b0 + b1 (价格) + b2 (广告费用)
3、周周销售量销售量价格价格(美元美元)广告广告(100美元美元)13505.503.324607.503.333508.003.044308.004.553506.803.063807.504.074304.503.084706.403.794507.003.5104905.004.0113407.203.5123007.903.2134405.904.0144505.003.5153007.002.7多元回归方程:.Chap 13-8多元回归的Excel 输出Regression StatisticsMultiple R0.72213R Square0.52148Adjusted R Squa
4、re0.44172Standard Error47.46341Observations15ANOVA dfSSMSFSignificance FRegression229460.02714730.0136.538610.01201Residual1227033.3062252.776Total1456493.333 CoefficientsStandard Errort StatP-valueLower 95%Upper 95%Intercept306.52619114.253892.682850.0199357.58835555.46404Price-24.9750910.83213-2.3
5、05650.03979-48.57626-1.37392Advertising74.1309625.967322.854780.0144917.55303130.70888Sales 306.526 - 24.975() 74.131()价格广告费用.Chap 13-9多元回归的Minitab 输出The regression equation isSales = 307 - 25.0 Price + 74.1 Advertising Predictor Coef SE Coef T PConstant306.50 114.30 2.68 0.020Price -24.98 10.83 -2.
6、31 0.040Advertising 74.13 25.97 2.85 0.014 S = 47.4634 R-Sq = 52.1% R-Sq(adj) = 44.2% Analysis of Variance Source DF SS MS F PRegression 2 29460 14730 6.54 0.012Residual Error 12 27033 2253Total 14 56493Sales 306.526 - 24.975() 74.131()价格广告费用.Chap 13-10多元回归方程 306.526 - 24.975() 74.131()销量价格广告费用b1 =
7、-24.975: 给定广告费用时,价格每上涨1美元,销售量平均每周减少24.975个b2 = 74.131:给定销售价格时,广告费用每增加100美元,销售量平均每周增加74.131个其中 销量以每周卖出的个数为单位 价格以美元为单位广告费用以100美元为单位.Chap 13-11利用多元回归方程做预测预测销售价格为5.50美元,广告费用为350美元时一周的销售量:预测销量为 428.62 个馅饼 306.526 - 24.975() 74.131() 306.526 - 24.975 (5.50) 74.131 (3.5) 428.62销量价格广告费用注意广告费用是以100美元为单位的,所以在
8、350美元也就意味着 X2 = 3.5.Chap 13-12在Excel中利用 PHStat做预测nPHStat | regression | multiple regression 点击对话框 “confidence and prediction interval estimates”.Chap 13-13输入值在Excel中利用PHStat做预测(续)预测值Y给定X值,Y均值的置信区间给定X值,单个Y值的预测区间.Chap 13-14在 Minitab中的预测输入值Predicted Values for New Observations NewObs Fit SE Fit 95% CI
9、95% PI 1 428.6 17.2 (391.1, 466.1) (318.6, 538.6) Values of Predictors for New Observations NewObs Price Advertising 1 5.50 3.50Y 预测值给定X,Y均值的置信区间 给定X,单个Y值的预测区间.Chap 13-15多元可决系数n描述了Y的变化中能被一组变量X解释的部分所占的比例2SSRrSST回归总平方和总平方和.Chap 13-16Regression StatisticsMultiple R0.72213R Square0.52148Adjusted R Squar
10、e0.44172Standard Error47.46341Observations15ANOVA dfSSMSFSignificance FRegression229460.02714730.0136.538610.01201Residual1227033.3062252.776Total1456493.333 CoefficientsStandard Errort StatP-valueLower 95%Upper 95%Intercept306.52619114.253892.682850.0199357.58835555.46404Price-24.9750910.83213-2.30
11、5650.03979-48.57626-1.37392Advertising74.1309625.967322.854780.0144917.55303130.70888.5214856493.329460.0SSTSSRr252.1%馅饼的销量变化可以由馅饼价馅饼的销量变化可以由馅饼价格的变化和广告费用的变化来解释格的变化和广告费用的变化来解释在Excel输出中的多元可决系数.Chap 13-17在Minitab输出中的多元可决系数The regression equation isSales = 307 - 25.0 Price + 74.1 Advertising Predictor C
12、oef SE Coef T PConstant306.50 114.30 2.68 0.020Price -24.98 10.83 -2.31 0.040Advertising 74.13 25.97 2.85 0.014 S = 47.4634 R-Sq = 52.1% R-Sq(adj) = 44.2% Analysis of Variance Source DF SS MS F PRegression 2 29460 14730 6.54 0.012Residual Error 12 27033 2253Total 14 56493.5214856493.329460.0SSTSSRr2
13、52.1%馅饼的销量变化可以由馅馅饼的销量变化可以由馅饼价格的变化和广告费用的变化饼价格的变化和广告费用的变化来解释来解释.Chap 13-18调整后的 r2n当模型中加入一个新的变量X时,r2 肯定不会减少n当比较模型时,这是一个劣势n当加入一个新变量时,有什么净影响呢?n当加入一个新变量X时,我们失去了一个自由度n添加一个新变量X的说服力是否足以抵消失去一个自由度的损失?.Chap 13-19n调整变量Y可以被变量X解释的比例以反映自变量个数和样本大小 (其中 n = 样本量, k = 自变量个数)n惩罚过度使用不重要的自变量n比 r2小n在模型比较中有用调整后的 r2(续)11)1 (1
14、22knnrradj.Chap 13-20Regression StatisticsMultiple R0.72213R Square0.52148Adjusted R Square0.44172Standard Error47.46341Observations15ANOVA dfSSMSFSignificance FRegression229460.02714730.0136.538610.01201Residual1227033.3062252.776Total1456493.333 CoefficientsStandard Errort StatP-valueLower 95%Uppe
15、r 95%Intercept306.52619114.253892.682850.0199357.58835555.46404Price-24.9750910.83213-2.305650.03979-48.57626-1.37392Advertising74.1309625.967322.854780.0144917.55303130.70888.44172r2adj考虑了样本量和自变量的个数,馅饼销量变化考虑了样本量和自变量的个数,馅饼销量变化的的44.2%可以被销售价格的变化和广告费用的可以被销售价格的变化和广告费用的变化解释变化解释在 Excel输出中的调整r2.Chap 13-21在
16、Minitab输出中的调整r2The regression equation isSales = 307 - 25.0 Price + 74.1 Advertising Predictor Coef SE Coef T PConstant306.50 114.30 2.68 0.020Price -24.98 10.83 -2.31 0.040Advertising 74.13 25.97 2.85 0.014 S = 47.4634 R-Sq = 52.1% R-Sq(adj) = 44.2% Analysis of Variance Source DF SS MS F PRegression 2 29460 14730 6.54 0.012Residual Error 12 27033 2253Total 14 56493.44172r2adj考虑了样本量和自变量的考虑了样本量和自变量的个数,馅饼销量变化的个数,馅饼销量变化的44.2%可以被销售价格的变可以被销售价格的变化和广告费用的变化解释化和广告费用的变化解释.Chap 13-22这个模型显著吗?nF 检验检验模型整体的显著性