图表 5 初始因子载荷矩阵
从图表3可知GDP与工业增加值,第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、地方财政收入这几个指标存在着极其显著的关系,与海关出口总额存在着显著关系。可见许多变量之间直接的相关性比较强,证明他们存在信息上的重叠。
主成分个数提取原则为主成分对应的特征值大于1的前m个主成分。注:特征值在某种程度上可以被看成是表示主成分影响力度大小的指标,如果特征值小于1,说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大,因此一般可以用特征值大于1作为纳入标准。通过图表4(方差分解主成分提取分析)可知,提取2个主成分,即m=2,从图表5(初始因子载荷矩阵)可知GDP、工业增加值、第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、海关出口总额、地方财政收入在第一主成分上有较高载荷,说明第一主成分基本反映了这些指标的信息;人均GDP和农业增加值指标在第二主成分上有较高载荷,说明第二主成分基本反映了人均GDP和农业增加值两个指标的信息。所以提取两个主成分是可以基本反映全部指标的信息,所以决定用两个新变量来代替原来的十个变量。但这两个新变量的表达还不能从输出窗口中直接得到,因为“Component Matrix”是指初始因子载荷矩阵,每一个载荷量表示主成分与对应变量的相关系数。
用图表5(主成分载荷矩阵)中的数据除以主成分相对应的特征值开平方根便得到两个主成分中每个指标所对应的系数[2]。将初始因子载荷矩阵中的两列数据输入(可用复制粘贴的方法)到数据编辑窗口(为变量B1、B2),然后利用“TransformàCompute Variable”,在Compute Variable对话框中输入“A1=B1/SQR(7.22)” [注:第二主成分SQR后的括号中填1.235],即可得到特征向量A1(见图表6)。同理,可得到特征向量A2。将得到的特征向量与标准化后的数据相乘,然后就可以得出主成分表达式[注:因本例只是为了说明如何在SPSS进行主成分分析,故在此不对提取的主成分进行命名,有兴趣的读者可自行命名]:
F1=0.353ZX1+0.042ZX2-0.041ZX3+0.364ZX4+0.367ZX5+0.366ZX6+0.352ZX7+0.364ZX8+0.298ZX9+0.355ZX10
F2=0.175ZX1-0.741ZX2+0.609ZX3-0.004ZX4+0.063ZX5-0.061ZX6-0.022ZX7+0.158ZX8-0.046ZX9-0.115ZX10
图表 6 Compute Variable对话框
前文提到SPSS会自动对数据进行标准化,但不会直接给出,需要我们自己另外算,我们可以通过AnalyzeàDescriptive Statisticsà Descriptives对话框来实现:弹出Descriptives对话框后,把X1~X10选入Variables框,在Save standardized values as variables前的方框打上钩,点击“OK”,经标准化的数据会自动填入数据窗口中,并以Z开头命名。
图表 7 Descriptives对话框
以每个主成分所对应的特征值占所提取主成分总的特征值之和的比例作为权重计算主成分综合模型:
即可得到主成分综合模型:
F=0.327ZX1-0.072ZX2+0.054ZX3+0.310ZX4+0.323ZX5+0.304ZX6
+0.297ZX7+0.334ZX8+0.248ZX9+0.286ZX10
根据主成分综合模型即可计算综合主成分值,并对其按综合主成分值进行排序,即可对各地区进行综合评价比较,结果见图表8。
图表 8 综合主成分值
城市 |
第一主成分F1 |
排名 |
第二主成分F2 |
排名 |
综合主成分F |
排名 |
广东 |
5.23 |
1 |
0.11 |
6 |
4.48 |
1 |
江苏 |
2.25 |
2 |
0.23 |
5 |
1.96 |
2 |
山东 |
1.96 |
3 |
0.50 |
2 |
1.75 |
3 |
浙江 |
1.16 |
4 |
-0.19 |
8 |
0.96 |
4 |
上海 |
0.30 |
5 |
-2.36 |
10 |
-0.09 |
5 |
辽宁 |
-1.24 |
6 |
1.96 |
1 |
-0.78 |
6 |
河北 |
-1.35 |
7 |
0.41 |
4 |
-1.10 |
7 |
福建 |
-1.97 |
8 |
-0.07 |
7 |
-1.70 |
8 |
天津 |
-3.04 |
9 |
-1.01 |
9 |
-2.74 |
9 |
广西 |
-3.29 |
10 |
0.41 |
3 |
-2.75 |
10 |
对得出的综合主成分(评价)值,我们可用实际结果、经验与原始数据做聚类分析进行检验,对有争议的结果,可用原始数据做判别分析解决争议,具体评价与检验本文不做论述,如读者有兴趣可自行进行检验论述。
四、小结
本文旨在阐述如何利用SPSS软件进行正确的主成分分析,使读者能正确使用SPSS进行主成分分析,以解决实际问题;避免出现读者因子分析与主成分分析混用的情况,并希望今后的相关教科书能够说明清楚主成分分析在SPSS中的操作。
参考文献
[1] 于秀林,任雪松.多元统计分析[M].北京:中国统计出版社,1999.8.P154
[2] 林海明,张文霖.主成分分析与因子分析详细的异同和SPSS软件[J].统计研究2005 |