Cox Regression过程主要用于:
1、 用以描述多个变量对生存时间的影响。此时可控制一个或几个因素,考察其他因素对生存时间的影响,及各因素之间的交互作用。
例13.3 40名肺癌患者的生存资料(详见胡克震主编的《医学随访统计方法》1993,77页)
生存时间 |
状态 |
生活能力评分 |
年龄 |
诊断到研究时间 |
鳞癌 |
小细胞癌 |
腺癌 |
疗法 |
癌症类别 |
411 |
1 |
70 |
64 |
5 |
1 |
0 |
0 |
1 |
1.00 |
126 |
1 |
60 |
63 |
9 |
1 |
0 |
0 |
1 |
1.00 |
118 |
1 |
70 |
65 |
11 |
1 |
0 |
0 |
1 |
1.00 |
注:原数据库是用亚变量定义肺癌分类:0,0,0为其它癌;1,0,0为鳞癌;0,1,0为小细胞癌;0,0,1为腺癌。表中的最后一个变量是我加上去的癌症类别,1为鳞癌;2为小细胞癌;3为腺癌;4为其它癌。实践表明结果与用亚变量计算一样。
13.3.1 界面说明
图9 Cox回归主对话框
【Time】框、【Status】框前文已经介绍过了,这里我就不再废话唠叨的了。Block 1 of 1右边的Next钮被激活。这个按钮用于确定不同自变量进入回归方程的方法,详见Method框的内容。用同一种方法进入回归方程的自变量在同一个Covariates框内。
【Covariates】框
选入自/协变量,即选入你认为可能对生存时间有影响的变量。
【Method】框
选择自变量进入Cox回归方程的方法,SPSS提供下面几种方法:
-
Enter: Covariates框内的全部变量均进入回归模型。
-
Forward: Conditional: 基于条件参数估计的向前法。
-
Forward: LR: 基于偏最大似然估计的向前法。
-
Forward: Wald: 基于Wald统计量的向前法。
-
Backward: Conditional: 基于条件参数估计的后退法。
-
Backward: LR: 基于偏最大似然估计的后退法。
-
Backward: Wald: 基于Wald统计量的后退法。
【Strata】框
定义分层因素,将生存时间按分层因素分别进行Cox回归。
【Categorical】选项
用于告诉系统,Covariates框内的变量中哪些是分类变量或字符型变量。系统默认字符型变量为分类变量,数字型变量为连续型变量。
选入自变量后,categorical钮被激活。按categorical钮,进入确定分类变量的对话框。见图10。
图10 确定分类变量对话框
左边的Covariates框中列出了刚刚被选取的自变量,将分类变量选入Categorical Covariates框中。此时Change Contrast框被激活,请你选择比较方法,即计算参数OR/βi的方法。当选入分类变量后,Change Contrast框被激活,此时可选择比较方法。SPSS提供下面几种比较方法。
-
Indicator:指示对比。用于指定某一分类变量的基线,即参照水平。这样计算出来的参数OR/βi是以该变量的第一个或最后一个水平为基准水平(取决于下面的reference category中你选择的是last还是first)。在这里SPSS自动创建亚变量,对照水平在对比分类矩阵中用0行代表。在这里我再多说两句,如本例中的肿瘤类型,若规定鳞癌为1,小细胞癌为2,腺癌为3,其它癌为4。若选indicator及last,则以其它癌为参照,计算出来的OR及βi是以其它癌为基准,即其它癌的OR为1,其他计算出来的OR值是与其它癌相比的结果。
-
Simple:差别对比。可计算该分类变量的各水平与参照水平相比的OR值。参照水平自己当然就不用跟自己相比了。对于本例来说,Simple与Indicator选项是一样的,前提是下面的Reference Category中你所选择的同是last(或first)。
-
Difference:差别对比。分类变量欲比较水平与其前面的各水平平均值进行比较,当然也不包括第一水平。与Helmert法相反,因此也叫反Helmert法。如3水平与1、2水平的平均值相比,下同。
-
Helmert:赫尔默特对比。分类变量欲比较水平与其后面各水平平均值进行比较,当然不包括最后一个水平。
-
Repeated:重复对比。分类变量的各水平与其前面相邻的水平相比较(第一水平除外)。
-
Polynomial:多项式对比。仅用于数字型的分类变量。无效假设是假设各水平是等距离的(可以是线性的关系,也可以是立方、四次方的关系)。例如年龄每增加10岁,死亡风险的增加值是一样的,但实际情况常常与此相反,如在20岁与60岁年龄段,年龄都增加10岁,所增加的死亡风险肯定是不一样的,具体情况需根据各人的研究课题,专业而定。
-
Deviation:离差对比。除了所规定的参照水平外,其余每个水平均与总体水平相比。
-
Reference category:如果你选择了Deviation, Simple, 或Indicator三个选项,就必须选择First或Last作为参照水平。
完成上述选择后,击change钮,确认选择。
你若对上面写的一段不感兴趣的话,可跳过去,直接用系统默认的选项。
【Plots】选项
图11 Cox回归统计图对话框
Survival:累积生存函数曲线。
Hazard:累积风险函数曲线。
Log minus log:对数累积生存函数乘以-1后再取对数。
One minus survival:生存函数被1减后的曲线。
-
Change Value:系统默认用各变量的均数进行作图,但对字符型变量如癌症类型取均值则没有实际意义。若用分类变量的其它水平进行作图,则选定该变量,此时Change Value钮被激活,按Value钮,在其右边的框内输入你所想要用于作图的值。击Change。
-
Separate Line for:输入分类变量的名称,此时可以用分类变量的不同水平进行作图,对于本例则可作出不同癌症的曲线。此分类变量必须包括在前面的自变量框中。
【Save】存为新变量
图12 Cox回归存为新变量对话框
l Survival:生存函数。
Function:累积生存函数估计值。
Standard error:累积生存函数估计值的标准误。
Log minus log:对数累积生存函数乘以-1后再取对数。
l Diagnostics:回归诊断。
Hazard function Cox-Snell:残差。
Partial residual:偏残差。
Dfbeta(s):剔除某一观察单位后的回归系数变化量。
X*Beta:线性预测得分。
【Options】选项
击Options按钮,弹出选项对话框。
图13 Cox回归选项对话框
l Model Statistics:模型统计量。
CI for exp(ß) 95%:相对危险度的可信区间。系统默认95%可信区间。
Correlation of estimates:回归系数的相关阵。
l Display model:输出模型方式。
l At each step:输出每一步的模型。系统默认。
l At last step:输出最后一步的模型。
l Probability for Stepwise:模型保留变量的显著性水平。
Entry:系统默认选入变量为P≤0.05。
Removal:系统默认剔除变量为P>0.10。
Maximum Iterations:最大迭代次数,系统默认20次。
Display baseline function:输出风险基准函数以及基于各协变量均值的生存函数与风险函数。
操作如下:
1. Analyze==>Survival ==>Cox regression
2. Time框:选入survival time
3. Status框:选入status;击define events钮,在single value框右边的空格中输入1;
4. Covariate框:选入x1,x2,x3,x7,x8;
5. Categorical列表框:选入x8;
6. Plots 列表框:
l Plot Type:选survival;
l Separate Line for:选入x8;
7. Option列表框:
l Model Statistics:
选CI for exp(ß):输出回归系数ß的95%可信区间。
选Correlation of estimate:输出自变量的相关矩阵。
单击OK钮 |