Ⅳ.对照调查比较 — 配对调查资料的条件 Logistic 回归分析 1. 1:1 病例对照研究的基本概念 在管理工作中,我们也经常要开展对照调查。例如为什么有的人患了胃癌,有的人却不会患胃癌?如果在同一居住地选取同性别、年龄相差仅 ±2 岁的健康人作对照调查,调查他们与患胃癌有关的各种影响因素,这就是医学上很常用的所谓“1:1 病例对照研究”。 病例对照研究资料常用条件Logistic 回归分析。条件Logistic 回归模型(conditional logistic regression model,CLRM),下称CLRM 模型。 2. 条件Logistic 回归模型的一个实例 某地在肿瘤防治健康教育、社区干预工作中做了一项调查,内容是三种生活因素与胃癌发病的关系。调查的三种生活因素取值见表 11-6。 请拟合条件Logistic 回归模型,说明胃癌发病的主要危险因素。 表 11-6 三种生活因素与胃癌发病关系的取值 ------------------------------------------------------------------------------------------ 变 量 名 取 值 范 围 ------------------------------------------------------------------------------------------ X1 (不良生活习惯) 0,1,2,3,4 表示程度(0 表示无,4 表示很多) X2 (喜吃卤食和盐腌食物) 0,1,2,3,4 表示程度(0 表示不吃,4 表示喜欢吃、吃很多) X3 (精神状况) 0 表示差,1 表示好 ------------------------------------------------------------------------------------------
表 11-7 50 对胃癌病例(S=1)与对照(S=0)三种生活习惯调查结果 ------------------------------------------------------------------------------------------ 病例 对照 病例 对照 ----------------------------------------------------------------------------- No S X1 X2 X3 No S X1 X2 X3 No S X1 X2 X3 No S X1 X2 X3 ------------------------------------------------------------------------------------------ 1 1 2 4 0 1 0 3 1 0 26 1 2 2 0 26 0 1 1 0 2 1 3 2 1 2 0 0 1 0 27 1 2 0 1 27 0 0 2 1 3 1 3 0 0 3 0 2 0 1 28 1 1 1 1 28 0 3 0 1 4 1 3 0 0 4 0 2 0 1 29 1 2 0 1 29 0 4 0 0 5 1 3 0 1 5 0 0 0 0 30 1 3 1 0 30 0 0 2 1 6 1 2 2 0 6 0 0 1 0 31 1 1 0 1 31 0 0 0 0 7 1 3 1 0 7 0 2 1 0 32 1 4 2 1 32 0 1 0 1 8 1 3 0 0 8 0 2 0 0 33 1 4 0 1 33 0 2 0 1 9 1 2 2 0 9 0 1 0 1 34 1 2 0 1 34 0 0 0 1 10 1 1 0 0 10 0 2 0 0 35 1 1 2 0 35 0 2 0 1 11 1 3 0 0 11 0 0 1 1 36 1 2 0 0 36 0 2 0 1 12 1 3 4 0 12 0 3 2 0 37 1 0 1 1 37 0 1 1 0 13 1 1 1 1 13 0 2 0 0 38 1 0 0 1 38 0 4 0 0 14 1 2 2 1 14 0 0 2 1 39 1 3 0 1 39 0 0 1 0 15 1 2 3 0 15 0 2 0 0 40 1 2 0 1 40 0 3 0 1 16 1 2 4 1 16 0 0 0 1 41 1 2 0 0 41 0 1 0 1 17 1 1 1 0 17 0 0 1 1 42 1 3 0 1 42 0 0 0 1 18 1 1 3 1 18 0 0 0 1 43 1 2 1 1 43 0 0 0 0 19 1 3 4 1 19 0 2 0 0 44 1 2 0 1 44 0 1 0 0 20 1 0 2 0 20 0 0 0 0 45 1 1 1 1 45 0 0 0 1 21 1 3 2 1 21 0 3 1 0 46 1 0 1 1 46 0 0 0 0 22 1 1 0 0 22 0 2 0 1 47 1 2 1 0 47 0 0 0 0 23 1 3 0 0 23 0 2 2 0 48 1 2 0 1 48 0 1 1 0 24 1 1 1 1 24 0 0 1 1 49 1 1 2 1 49 0 0 0 1 25 1 1 2 0 25 0 2 0 0 50 1 2 0 1 50 0 0 3 1 ------------------------------------------------------------------------------------------- 3. 条件Logistic 回归模型的拟合原理与方法 本例以 SPSS 软件包来拟合 CLRM 模型。SPSS 虽有一个 LOGISTIC REGRESSION 命令,却无法拟合条件 Logistic 模型(CLRM),但有拟合 Cox 回归模型的固有命令(COXREG)。 回顾一下Cox 回归模型的公式: h (t,X) = h0(t) exp (X1 β1 + X2 β2 + ...+ Xp βp) 将两侧同时取对数可得: LN(h(t,X)) = LN (h0(t)) + (X1 β1 + X2 β2 + ...+ Xp βp) 如果是含有分层变量的Cox 回归模型, 则公式变为: LN(h(t,X)) = LN (h0i(t)) + (X1 β1 + X2 β2 + ...+ Xp βp) 各层的基线风险函数h0i(t) 可以完全无关,而协变量的系数则在所有层中保持不变。作 为半参数的方法,Cox 模型在拟合时并不估计基线风险函数h0i(t),只估计各协变量的系数值β。这则与条件 Logistic 回归模型不关心αi 的大小,只解出系数值β的思路一致。而且两者都以最大似然法(LR)来拟合。把配对因素作为分层因素,即可消除配对因素的作用,因此可用分层变量控制法的原理,来拟合条件 Logistic 回归模型。 在使用SPSS的COXREG 命令拟合条件 Logistic 模型时(Analyze → Survival → Cox Regression),要回答下列5个对话框: ① Time: 给每行记录一个虚拟的生存时间(Time),一般默认“病例” 生存时间短(例如为“1”),“对照” 生存时间长(例如为“2”)。只要“对照” 的生存时间(例如“2”~“100”)长于“病例”即可。因为SPSS 会把在最短的完全数据的生存时间之前的截尾数据(Censored)全部去掉而不参加分析。输出分层状态时,Event=“1”;Censored= “2”。 ② Status 与 Define Event: 选入虚拟生存状态变量。定义事件时“病例”全为“1”(Single value),为完全数据;“对照” 全“0”,为截尾数据。此值“1”表示事件已发生,本例即“病例”。 ③ Covariates: 选入要进行分析的协变量(即自变量 X1,X2,X3)。 ④ Method: 用 FSTEP(LR),即似然比法。 ⑤ Strata: 录入配对的对子号,“1”指第1 个对子(含“病例”为“1”一行与“对照” 者为“0”一行);“2”指第2 个对子。本例指变量“No”。 4. 拟合条件Logistic 回归模型所用程序文件 所用程序文件名为 CondLogiRegre.sps。 *Conditional Logistic Regression; filename: CondLogiRegre.sps. *---------------------------------------------------------------. *Fang Ji-Qian: Med. Stat. and Computer Experiment, P.492:. * Using COX-Regression to fit Conditional Logistic Regression:. DATA LIST FREE /No Status Time x1 x2 x3. BEGIN DATA. 1 1 1 2 4 0 1 0 2 3 1 0 2 1 1 3 2 1 2 0 2 0 1 0 3 1 1 3 0 0 3 0 2 2 0 1 4 1 1 3 0 0 4 0 2 2 0 1 5 1 1 3 0 1 5 0 2 0 0 0 6 1 1 2 2 0 6 0 2 0 1 0 7 1 1 3 1 0 7 0 2 2 1 0 8 1 1 3 0 0 8 0 2 2 0 0 9 1 1 2 2 0 9 0 2 1 0 1 10 1 1 1 0 0 10 0 2 2 0 0 11 1 1 3 0 0 11 0 2 0 1 1 12 1 1 3 4 0 12 0 2 3 2 0 13 1 1 1 1 1 13 0 2 2 0 0 14 1 1 2 2 1 14 0 2 0 2 1 15 1 1 2 3 0 15 0 2 2 0 0 16 1 1 2 4 1 16 0 2 0 0 1 17 1 1 1 1 0 17 0 2 0 1 1 18 1 1 1 3 1 18 0 2 0 0 1 19 1 1 3 4 1 19 0 2 2 0 0 20 1 1 0 2 0 20 0 2 0 0 0 21 1 1 3 2 1 21 0 2 3 1 0 22 1 1 1 0 0 22 0 2 2 0 1 23 1 1 3 0 0 23 0 2 2 2 0 24 1 1 1 1 1 24 0 2 0 1 1 25 1 1 1 2 0 25 0 2 2 0 0 26 1 1 2 2 0 26 0 2 1 1 0 27 1 1 2 0 1 27 0 2 0 2 1 28 1 1 1 1 1 28 0 2 3 0 1 29 1 1 2 0 1 29 0 2 4 0 0 30 1 1 3 1 0 30 0 2 0 2 1 31 1 1 1 0 1 31 0 2 0 0 0 32 1 1 4 2 1 32 0 2 1 0 1 33 1 1 4 0 1 33 0 2 2 0 1 34 1 1 2 0 1 34 0 2 0 0 1 35 1 1 1 2 0 35 0 2 2 0 1 36 1 1 2 0 0 36 0 2 2 0 1 37 1 1 0 1 1 37 0 2 1 1 0 38 1 1 0 0 1 38 0 2 4 0 0 39 1 1 3 0 1 39 0 2 0 1 0 40 1 1 2 0 1 40 0 2 3 0 1 41 1 1 2 0 0 41 0 2 1 0 1 42 1 1 3 0 1 42 0 2 0 0 1 43 1 1 2 1 1 43 0 2 0 0 0 44 1 1 2 0 1 44 0 2 1 0 0 45 1 1 1 1 1 45 0 2 0 0 1 46 1 1 0 1 1 46 0 2 0 0 0 47 1 1 2 1 0 47 0 2 0 0 0 48 1 1 2 0 1 48 0 2 1 1 0 49 1 1 1 2 1 49 0 2 0 0 1 50 1 1 2 0 1 50 0 2 0 3 1 END DATA. LIST VARIABLES=ALL /FORMAT=NUMBERED /CASES=FROM 1 TO 50. * When programing:. * "Status": "Case"=1; "Control"=0. * "Time": "Case"=1; "Control"=2, that is, the survival time of "Control" should longer than "Case". * "Define Event": Single value: "1" means "Case". * "Covariate": Inpute the independence variables. * "Method": ENTER, FSTEP, BSTEP, etc. * "Strata": The No. of per pairs, that is,No. COXREG Time /STATUS=Status(1) /STRATA=No /METHOD=FSTEP(LR) X1 X2 X3 /PRINT=DEFAULT CI(95) /CRITERIA=PIN(0.05) POUT(0.1) ITERATE(20). *--------------------------------------------------------------------------. 5. 拟合条件Logistic 回归模型的主要运算结果 运行程序文件 CondLogiRegre.sps 可得到下列主要结果: Variables in the Equation B SE Wald df Sig. Exp(B) 95.0% CI for Exp(B) Lower Upper Step 1 X1 0.659 0.220 8.973 1 0.003 1.932 1.256 2.973 Step 2 X1 0.785 0.257 9.351 1 0.002 2.193 1.326 3.629 X2 0.814 0.307 7.042 1 0.008 2.257 1.237 4.118 回归系数 B 表示病例与对照变量值之差与患病优势的关系,即 Exp(B) 表示病例与对照暴露水平相差 1 个单位时患病的比数比(Odd Ratio, OR)。从表中可见,X3(精神状况)未被引入回归模型,只引入影响因素 X1 与 X2,说明精神状况的好坏与胃癌发病无显著相关,而 X1 (不良生活习惯) 和X2 (喜吃卤食和盐腌食物)与患胃癌有较密切的关系。 注意:X1 与 X2 的回归系数 B 都是正值(前者为0.785,后者为0.814),OR 值都大于 1(前者 Exp(B) = OR = 2.193,后者 Exp(B) = OR = 2.257),而且都有统计学显著性(前者 Sig.= P = 0.002,后者 P = 0.008)。说明不良生活习惯、喜吃卤食和盐腌食物会增加胃癌发病机会;而且不良生活习惯越多、卤食和盐腌食物吃得越多,胃癌发病的机会就越大。 |