§12.1 概论
作为二十一世纪统计理论的三大发展方向之一,非参数统计是统计分析的重要组成部分。可是与之很不相称的是他针对一般性统计分析的理论发展远远不及参数检验完善,因而比较完善的可供使用的方法也不多。比如多组均数间的两两比较,虽然已有好几种方法可资利用,但由于在理论上仍存在争议,几种权威的统计软件(如SAS和SPSS)均没有提供这方面的方法。
虽然这些洋统计软件没有提供两两比较的非参数方法,但国产的统计软件大都是提供了的(国情不同嘛),因此建议大家:如果真的要做这方面的非参数分析,不如直接用PEMS、SPLMWIN、NOSA等国产软件,免得用SPSS等只能做一半。
在SPSS中,几乎所有的非参数分析方法都被放入了Nonparametric Tests菜单中,具体来讲有以下几种:
-
Chi-square test:用卡方检验来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%,我随便写的)。请注意该检验和我们一般所用的卡方不太一样,我们一般左的卡方要用crosstable菜单来完成,而不是这里。
-
Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一刀两断。
-
Runs Test:用于检验某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。
-
One-Sample Kolmogorov-Smirnov Test:采用柯尔莫诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。
-
Two-Independent-Samples Tests:即成组设计的两样本均数比较的非参数检验。
-
Tests for Several Independent Samples:成组设计的多个样本均数比较的非参数检验,此处不提供两两比较方法。
-
Two-Related-Samples Tests:配对设计两样本均数的非参数检验。
-
Tests for Several Related Samples:配伍设计多个样本均数的非参数检验,此处同样不提供两两比较。
难道两分类的变量还可能不服从二项分布?是的,比如极端的均一分布(取值都是0或1),负二项分布等。最常见的如传染病的发病,是否发病是绝对不服从二项分布的(因两个观察结果间会有关联)。
由于上述各种统计方法都比较简单,且对话框和结果都比较相似,可以举一反三,我就不准备一一介绍了,只介绍其中有代表性的两个--Kolmogorov-Smirnov Test和Two-Independent-Samples Tests。
其实我是想写详细点的,真正阻止我这样作的原因是我实在太忙了,真的真的太忙了。
§12.2 One-Sample Kolmogorov-Smirnov Test
例12.1 请判断SPSS自带数据集anxity.sav中score的分布是否服从正态分布。
闲言少叙,操作如下:
-
Analyze==>Nonparametic test==>1-sample K-S
-
Test variable list框:选入score
-
Test distribution复选框组:选中normal复选框
-
单击OK钮
系统给出的统计分析结果非常简单,具体如下:
NPar Tests
上表给出了所检验变量的常用正态描述指标(即均数、标准差),检验的中间结果和最终结果。从上可见P值为0.652,即score是服从正态分布的。
上表翻译如下:
|
|
变量名Score |
样本量 |
|
48 |
正态分布参数 |
均数 |
10.00 |
|
标准差 |
5.17 |
最极端的差异 |
绝对值 |
.106 |
|
正值 |
.088 |
|
负值 |
-.106 |
K-S检验的统计量 Z值 |
|
.735 |
近似P值 (双侧) |
|
.652 |
§12.3 Two-Independent-Samples Tests
例12.2 请用非参数方法检验anxity.sav中第一次和第二次的评分结果是否有差异。
选择Analyze==>Nonparametic test==>Two-Independent-Samples,弹出的对话框和大家最初就接触的t检验对话框非常相似,只是在下面一共给出了四种检验方法,其中第一种Mann-Whitney U检验实际上就是大家都学过的两样本均数比较的秩和检验,只是换了个名称而已。这里我们就用它。本例的具体操作如下:
-
Analyze==>Nonparametic test==>Two-Independent-Samples
-
Test variable list框:选入score
-
grouping variables框:选入trial
-
单击Define groups钮
-
在group1框和group2框中分别输入1和2
-
单击continue钮
-
Test type 复选框组:选中Mann-Whitney U复选框
-
单击OK钮
前几天有位网友给我来信,问我在这个例子中只比较第一次和第二次的评分结果有无差异,是不是意味着在做四组间的两两比较?即"成组设计多独立样本非参数检验"可用"两独立样本Mann-Whitney U检验"来作两两比较?我一看这封信就吓了一跳!不好意思,引起了如此大的误会!!在这里我严正声明:我在这里只是为了省事,胡乱拉了一个例子而已。在我看来,"成组设计多独立样本非参数检验"用"两独立样本Mann-Whitney U检验"来作两两比较完全等价于用t检验代替方差分析中的的两两比较,如果一定要做,就必须要对Alpha水准进行调整(具体方法在倪宗瓒老师主编的《医学统计学》第二版里有),否则自然会出问题。
程序给出的分析结果如下:
NPar Tests
Mann-Whitney Test
上表为两组秩次情况的报告,可见第一次检查的智次和为212.5,平均秩次为17.71。第二次检查的则分别为87.5和7.29,显然,差距较大。
上表为统计分析的结果,分别给出了Mann-Whitney U检验值、Wilcoxon W检验值和Z值,以及近似P值和确切概率值。可见P值远小于0.05,因此刚才两组的平均秩次之差是有统计学意义的。 |