Ⅳ.时间序列数据的相关系数计算与一元线性回归预测法 1. 时间序列数据相关系数的计算方法 例如:某公司为了研究广告费支出(ad)对销售额(sale)的影响,统计了过去 10 个月的数据,请计算两者的相关系数。 问当投入广告费 1 万元时,估计的销售额会有多少? 表 7-3 某公司的广告费支出与销售额的关系(万元) ---------------------------------------------------------- 月份 广告费(ad) 销售额(sale) ------------------------------------------------------------------- 1 0.1 10.0 2 0.1 20.0 3 0.2 20.0 4 0.2 30.0 5 0.3 30.0 6 0.4 40.0 7 0.5 50.0 8 0.6 50.0 9 0.7 70.0 10 0.9 80.0 ------------------------------------------------------------------- 11 1.0 ------------------------------------------------------------------- 在程序文件(CorreRegre.sps,例 *1)的“BEGIN DATA”与“END DATA”之间,即录入表中第 (2) 列ad 与第 (3) 列 sale的数据。 计算相关系数的命令是“CORRELATION”,产生的过程是:Analyze → Correlate → Bivariate → 将 ad 与 sale 选入右侧的“Variables”窗中 → Paste。 2. 时间序列数据一元线性回归方程拟合与预测方法 要知道投入广告费(ad) 1 万元时,预测销售额(Esale)是多少,则为双变量的直线回归分析(引自王宪玉主编. 1999 年,P.166。数据有改动),即要计算一元线性回归方程: Y = b0 + b1×x1 本例为:Esale = b0 + b1 × ad SPSS 中的 REGRESSION 命令即可算得此回归方程。REGRESSION 命令产生的过程是:Analyze → Regression → Linear → 将 sale 选入 “Dependent” (因变量)窗中 → 将 ad 选入“Independent(s)” 窗中 → Paste。 用前述曲线拟合法同样可得此回归方程。曲线拟合的命令是“CURVEFIT”(直线是特殊形式的一种曲线!),此命令产生的过程是:Analyze → Regression → Curve Estimation → 将 sale 选入右侧的“Dependent(s)”窗中 →将 ad 选入右侧的“Independent”窗中(这时默认的拟合模型为直线回归方程 Linear)→ 击右下方的“Save”钮 → 将新出现的小窗中Save Variables中的“Predicted Values”、“Residuals”与“Prediction Intervals” 全勾选 → Continue → Paste → 出现 “CURVEFIT”命令。 上述 REGRESSION 与 CURVEFIT 两个命令的拟合结果是相同的;REGRESSION 命令也可得到相关系数的结果。 * Correlation and regression; Filename: CorreRegre.sps. *-----------------------------------------------------------------------. *1. From Wang Xian-Yu: Market Survey and the Prediction, P.166:. DATA LIST FREE /ad sale. BEGIN DATA. 0.1 10 0.1 20 0.2 20 0.2 30 0.3 30 0.4 40 0.5 50 0.6 50 0.7 70 0.9 80 END DATA. CORRELATIONS /VARIABLES=ad sale /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE . REGRESSION /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) CIN(95) /NOORIGIN /DEPENDENT=sale /METHOD=ENTER ad /CASEWISE=ALL /SAVE=PRED. GRAPH /LINE(MULTIPLE)=VALUE(sale, pre_1) BY ad. * Curve Estimation. CURVEFIT /VARIABLES=sale WITH ad /CONSTANT /MODEL=LINEAR /PLOT FIT /CIN=95 /SAVE=PRED RESID CIN. *-------------------------------------------------------------------------------. 用CORRELATIONS命令:相关系数计算结果,r = 0.980, P = 0.000。 Correlations AD SALE AD Pearson Correlation 1.000 .980 Sig. (2-tailed) . .000 N 10 10 SALE Pearson Correlation .980 1.000 Sig. (2-tailed) .000 . N 10 10 ** Correlation is significant at the 0.01 level (2-tailed). 用REGRESSION命令:相关系数计算结果相同,r = 0.980 (即 R = 0.980; R Square = R2 = 0.960), P = 0.000。 Model Summary Model R R Square Adjusted R Square Std. Error of the Estimate 1 0.980 0.960 0.956 4.7673 a Predictors: (Constant), AD
Coefficients Unstandardized Coefficients Standardized Coefficients t Sig. Model B Std. Error Beta 1 (Constant) 7.273 2.790 2.607 .031 AD 81.818 5.868 .980 13.943 .000 a Dependent Variable: SALE
Casewise Diagnostics(a) Case Number Std. Residual SALE Predicted Value Residual 1 -1.144 10.00 15.4545 -5.4545 2 .953 20.00 15.4545 4.5455 3 -.763 20.00 23.6364 -3.6364 4 1.335 30.00 23.6364 6.3636 5 -.381 30.00 31.8182 -1.8182 6 .000 40.00 40.0000 .0000 7 .381 50.00 48.1818 1.8182 8 -1.335 50.00 56.3636 -6.3636 9 1.144 70.00 64.5455 5.4545 10 -.191 80.00 80.9091 -.9091 a Dependent Variable: SALE
输出的预测值(Esale)即“Predicted Value”,见“Casewise”表第4 列。 在 REGRESSION 命令的子命令“/SAVE=PRED”中,可自行存储下预测值(Esale)的变量名“pre_1”,它可用于其下一句的绘图:“GRAPH /LINE(MULTIPLE)=VALUE(sale, pre_1) BY ad.”,并绘出如下拟合图: 回归方程Esale = b0 + b1×ad 的计算结果:b0 = Constant = 7.273,b1 = 81.818。可得: Esale = 7.273 + 81.818×ad。 当投入广告费(ad)1 万元时,估计的销售额为: Esale = 7.273 + 81.818×1 = 89.55 万元。 用CURVEFIT命令拟合直线回归方程的结果: 即Rsq = R Square = R2 = 0.960;即r = R = 0.980。可见 b0 = 7.2727 = 7.273, b1 = 81.8282 = 81.818, 结果同上。 Independent: AD ---------------------------------------------------------------------------- Dependent Mth Rsq d.f. F Sigf b0 b1 ---------------------------------------------------------------------------- SALE LIN 0.960 8 194.40 .000 7.2727 81.8182 ----------------------------------------------------------------------------
The following new variables are being created: ---------------------------------------------------------------------------- Name Label ---------------------------------------------------------------------------- FIT_1 Fit for SALE with AD from CURVEFIT, MOD_3 LINEAR ERR_1 Error for SALE with AD from CURVEFIT, MOD_3 LINEAR LCL_1 95% LCL for SALE with AD from CURVEFIT, MOD_3 LINEAR UCL_1 95% UCL for SALE with AD from CURVEFIT, MOD_3 LINEAR ---------------------------------------------------------------------------- 拟合图形详下。 |