第二节 数据的编辑
输入的原始数据,经常在统计分析前或统计分析过程中,需要作一些特殊的处理。为此,系统提供了如下主要方法。
2.2.1 数据的增删
2.2.1.1 增加一个新的变量列
例如要在第2列前增加一个新的列,使原来的第2列右移变成第3列,则可先激活第2列的任一单元格,然后选Data菜单的Insert Variable命令项,系统自动为用户在第2列前插入一个新的变量列,原第2列自动向右移一列成为第3列。
2.2.1.2 增加一个新的观察单位(即增加一个新的行)
例如要在第6个观察单位前增加一个观察单位(亦即在第6行前增加一行,使原来的第6行下移成为第7行),则可先激活第6行的任一单元格,然后选Data菜单的Insert Case命令项,系统自动为用户在第6行前插入一个新的行,原第6行列自动向下移一行成为第7行。
2.2.1.3 增加一个新的观察值
例如由于输入错误,造成第7个观察单位的第4个变量值漏输,结果第8个观察单位的第4个变量值误为第7个观察单位的第4个变量值,这样的情形使得数据管理器中的第4个变量值从第7行起全部上移,而合计例数少一个。于是希望在第7行的第4列处插入1个单元格,原有数据依次下移恢复正常。可先将鼠标指向在第7行第4列交叉处的单元格,然后按住鼠标左键向下拖动鼠标直至第4列从第7行起的所有数据被选中(黑底白字),选Edit菜单的Cut命令项,选中的数据被剪切入剪贴板,再激活第8行第4列交叉处的单元格,选Edit菜单的Paste命令项,可将剪贴板中的原第7行起的所有数据下移自第8行开始,并空出第7行第4列的单元格以便补入漏输的数值。
2.2.1.4 删除一个行
例如要删除第9行(即删除这个观察单位的所有观察值),则可先点击第9行的行头,这时整个第9行被选中(呈黑底白字状),然后按Delete键或选Edit菜单的Clear命令项,该行即被删除。
2.2.1.5 删除一个变量列
例如要删除第4个变量列,则可先点击第4列的列头,这时整个第4列被选中(呈黑底白字状),然后按Delete键或选Edit菜单的Clear命令项,该列即被删除。
2.2.1.6 删除一个观察值
例如由于输入错误,造成第6个观察单位的第2个变量值重复输入,结果第7个观察单位的第2个变量值误为第6个观察单位的第2个变量值,第8个观察单位的第2个变量值误为第7个观察单位的第2个变量值,……,这样的情形使得数据管理器中的第2个变量值从第7行起全部下移,而合计例数多一个。于是希望将第7行第2列的单元格删除,原有数据依次上移恢复正常。可先将鼠标指向在第8行第2列交叉处的单元格,然后按住鼠标左键向下拖动鼠标直至第2列从第8行起的所有数据被选中(黑底白字),选Edit菜单的Cut命令项,选中的数据被剪切入剪贴板,再激活第7行第2列交叉处的单元格,按Del键删除该单元格的数值,选Edit菜单的Paste命令项,可将剪贴板中的原第8行起的所有数据上移自第7行开始,既填补第7行第2列的单元格,又恢复原有下移的数值。
2.2.2 数据的整理
2.2.2.1 数据的排序
用户可按要求对数据管理器的数据进行排序。选Data菜单的Sort Cases...命令项,弹出Sort Cases...对话框(图1.7),在变量名列框中选1个需要按其数值大小排序的变量(用户也可选多个变量,系统将按变量选择的先后逐级依次排序),点击Ø钮使之进入Sort by框,然后在Sort Order框中确定是按升序(Ascending,从小到大)或降序(Descending,从大到小),点击OK钮即可。
2.2.2.2数据的行列互换
有时,用户需要将数据管理器中原先按行(列)方向排列的数据转换成按列(行)方向排列的数据,这时可选Data菜单的Transpose...命令项,弹出Transpose...对话框(图1.8),在变量名列框中选1个或多个需要转换的变量,点击Ø钮使之进入Variable(s)框,再点击OK钮即可。产生的新数据会在第1列出现一个case_lbl新变量,用于放置原来数值的变量名。若要将数据再转换回原来的排列方式,方法与上述过程相同。
2.2.2.3 数据的分组汇总
用户还可对数据管理器中的数据按指定变量的数值进行归类分组汇总,汇总的形式十分多样。例如,要对下列数据(图1.9)按变量group的大小,把变量x1作平均值汇总、把变量x2作求和汇总。选Data菜单的Aggregate...命令项,弹出Aggregate Data对话框(图1.10),在变量名列框中选group变量,点击Ø钮使之进入Break Variable(s)框,选x1变量进入Aggregate Variable(s)框,因x1欲作平均值汇总,故点击Function...钮弹出Aggregate Data: Aggregate Function对话框(图1.11)选Mean of values项点击Continue钮返回;选x2变量进入Aggregate Variable(s)框,因x2变量欲作求和汇总,故点击Function...钮选Sum of values项点击Continue钮返回。再点击OK钮即可。结果如图1.12所示。
分组汇总提供的函数形式有:
1、Mean of values:求该组的平均值;
2、Standard deviation:求该组的标准差;
3、First value:只保留该组的第1个数值;
4、Minimum value:只保留该组的最小值;
5、Last value:只保留该组的最后1个数值;
6、Maximum value:只保留该组的最大值;
7、Number of cases:合计该组的观察例数;
8、Sum of values :求该组所有观察值的和。
9、Percentage above :先确定1个数值,求大于该数值的所有例数占总例数的百分比(0-100%);
10、Percentage below:先确定1个数值,求小于该数值的所有例数占总例数的百分比(0-100%);
11、Fraction above:先确定1个数值,求大于该数值的所有例数占总例数的百分比(0-1);
12、Fraction below:先确定1个数值,求小于该数值的所有例数占总例数的百分比(0-1);
13、Percentage inside:先确定1个下限,再确定1个上限,求数值在该区间内的例数占总例数的百分比(0-100%);
14、Percentage outside:先确定1个下限,再确定1个上限,求数值在该区间外的例数占总例数的百分比(0-100%);
15、Fraction inside:先确定1个下限,再确定1个上限,求数值在该区间内的例数占总例数的百分比(0-1);
16、Fraction outside:先确定1个下限,再确定1个上限,求数值在该区间外的例数占总例数的百分比(0-1)。
2.2.2.4 数据的分割
数据也可根据需要,事先按用户的指定作分组(这种分组是系统内定义的,在数据管理器中并不一定明确体现,故亦可称之为分割),此后的所有分析都将按这种分组进行,除非取消数据分割的命令。选Data菜单的Split File...命令项,弹出Split File对话框(图1.13),选Repeat analysis for each group表示此后都按指定的分组方式作相同项目的分析,用户可从变量名列框中选1个或多个变量点击Ø钮使之进入Groups Based on框来作分组的依据。若在数据分割之后要取消这种分组,可选Analyze all cases项,则系统恢复如初。
调用Split File命令完成定义后,SPSS将在主窗口的最下面状态行中显示Split File On字样;若调用该命令后的数据库被用户存盘,则当这个数据文件再次打开使用时,仍会显示Split File On字样,意味着数据分割命令依然有效。 |