Ⅴ. 时间序列数据的多元线性回归预测法 1. 多元线性回归方程的含义 当预测指标受到多个因素影响时,可建立多元线性回归方程来进行分析和预测。“多元”是指两个以上自变量对因变量的影响。最简单的多元线性回归方程是二元线性回归方程: Y = b0 + b1 x1 + b2 x2 式中 x1、x2 为自变量(影响因素); b0、b1、b2 为回归系数(待定参数)。利用 SPSS 的 REGRESSION 命令,以最小二乘法可算出这些回归系数。 2. 多元线性回归方程的拟合与预测方法 例如:某公司对下一年度的商品销售额(Y)进行预测,选出两个主要影响因素(自变量):一是促销费用(x1);二是经营人员数(x2)。问该公司下一年度促销费用为 20万元、经营人员增至 35 人时,将有多少销售额? 表 7-4 某公司的促销费用、经营人员数与销售额的关系 ---------------------------------------------------------------- 序号 促销费用(万元) 经营人员 销售额(千万元) x1 x2 Y ------------------------------------------------------------------------ 1 17 29 26 2 18 32 30 3 16 25 24 4 19 34 32 5 18 33 31 6 18 31 30 7 17 30 27 8 18 30 27 --------------------------------------------------------------------------- 合计 141 244 227 --------------------------------------------------------------------------- 在程序文件(CorreRegre.sps,例 *2)的 BEGIN DATA 与 END DATA之间,即录入表中 x1 列、x2 列与 Y 列的数据。 SPSS 中的 REGRESSION 命令即可算得此二元线性回归方程。REGRESSION 命令产生的过程是:Analyze → Regression → Linear → 将 Y 选入 Dependent (因变量)窗中 → 将 x1 与 x2 选入 Independent(s) 窗中 → 击右下方的Save钮 → 将新出现的窗口中的Prediction Intervals 中的Mean 勾选 → Continue → Paste即出现下列程序中的“REGRESSION”一句命令。 计算相关系数的命令是“CORRELATION”,产生的过程是:Analyze → Correlate → Bivariate → 将 x1、x2 与 Y都选入右侧的 Variables 窗中 → Paste。 *------------------------------------------------------------------------------. *2. From Wang Xian-Yu: Market Survey and the Prediction, P.174:. DATA LIST FREE /x1 x2 y. BEGIN DATA. 17 29 26 18 32 30 16 25 24 19 34 32 18 33 31 18 31 30 17 30 27 18 30 27 END DATA. CORRELATIONS /VARIABLES=x1 x2 y /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE . REGRESSION /STATISTICS=COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) CIN(95) /NOORIGIN /DEPENDENT=y /METHOD=ENTER x1 x2 /CASEWISE=ALL /SAVE=PRED. *------------------------------------------------------------------------------. 用CORRELATIONS命令:相关系数计算结果,x1与x2 间r = 0.926, P = 0.001; x2 与 Y 间 r = 0.955, P = 0.000; x1与Y 间r = 0.906, P = 0.002。 Correlations X1 X2 Y X1 Pearson Correlation 1.000 .926 .906 Sig. (2-tailed) . .001 .002 N 8 8 8 X2 Pearson Correlation .926 1.000 .955 Sig. (2-tailed) .001 . .000 N 8 8 8 Y Pearson Correlation .906 .955 1.000 Sig. (2-tailed) .002 .000 . N 8 8 8 ** Correlation is significant at the 0.01 level (2-tailed). 用REGRESSION命令:复相关系数 R计算结果R = 0.957, R Square = R2 = 0.915。 Model Summary Model R R Square Adjusted R Square Std. Error of the Estimate 1 0.957 0.915 0.881 0.9568 a Predictors: (Constant), X2, X1 b Dependent Variable: Y
Coefficients Unstandardized Coefficients Standardized Coefficients t Sig. Model B Std. Error Beta 1 (Constant) -4.589 9.575 -.479 .652 X1 0.467 1.048 .154 .445 .675 X2 0.811 .346 .812 2.346 .066 a Dependent Variable: Y Casewise Diagnostics(a) Case Number Std. Residual Y Predicted Value Residual 1 -.906 26.00 26.8667 -.8667 2 .244 30.00 29.7667 .2333 3 .883 24.00 23.1556 .8444 4 .151 32.00 31.8556 .1444 5 .441 31.00 30.5778 .4222 6 1.092 30.00 28.9556 1.0444 7 -.708 27.00 27.6778 -.6778 8 -1.196 27.00 28.1444 -1.1444 a Dependent Variable: Y
回归方程Y = b0 + b1 x1 + b2 x2 的计算结果:b0 = Constant = -4.589,b1 = 0.467, b2 = 0.811。 所以可得: Y = -4.589 + 0.467 x1 + 0.811 x2。 输出的预测值(Y)即“Predicted Value”,见“Casewise”表第4列。 当下一年度促销费用 x1为 20万元、经营人员x2增至 35 人时,预测销售额Y: Y = -4.589 + 0.467× 20 + 0.811 × 35 = 33.14 千万元。 |