SPSS Logistic回归分析
用SPSS如何进行logistic回归分析
## Logistic回归分析在SPSS中的操作流程
### 1. 数据准备与变量设置
在进行Logistic回归分析前,需确保数据满足以下条件:
* **因变量**:应为二分类变量(如疾病发生/未发生、治疗有效/无效)。在SPSS中,通常将结局编码为0和1(例如,0=未发生,1=发生)。
* **自变量**:可为连续变量、二分类变量或多分类变量。对于多分类自变量(如种族、肿瘤分期),需在分析前将其设置为**哑变量**。
* **样本量**:根据现有指南,Logistic回归要求足够的样本量。一个常见的经验法则是每个自变量至少需要10-15个结局事件(即因变量=1的案例数)[7]。样本量不足可能导致模型不稳定或参数估计偏差。
### 2. 分析步骤
1. **路径**:依次点击 `分析(A)` -> `回归(R)` -> `二元Logistic...`。
2. **对话框设置**:
* **因变量**:将二分类结局变量选入“因变量(D)”框。
* **协变量**:将所有自变量(包括需要考察的暴露因素和需要控制的混杂因素)选入“协变量(C)”框。
* **方法**:在“方法(M)”下拉菜单中,选择自变量的筛选方法:
* **输入**:将所有选入的自变量强制纳入模型,不进行筛选[7]。
* **向前:条件** / **向后:条件**:基于条件参数估计进行向前或向后逐步回归。
* **向前:LR** / **向后:LR**:基于似然比检验进行向前或向后逐步回归。这是更常用的方法。
* **向前:Wald** / **向后:Wald**:基于Wald统计量进行逐步回归。
* **分类**:如果自变量中包含多分类变量(名义变量或有序变量),必须点击“分类(G)...”按钮,将其指定为“分类协变量”,并选择哑变量化的参照类别(通常为“第一个”或“最后一个”)。
* **保存**:可点击“保存(S)...”按钮,保存预测概率、残差等用于模型诊断。
* **选项**:可点击“选项(O)...”按钮,设置如“分类图”、“Hosmer-Lemeshow拟合优度”和“Exp(B)的CI”等。
### 3. 结果解读关键指标
运行分析后,需重点关注以下输出表格:
* **“块 1: 方法 = 输入/向前 LR 等”下的“模型系数的综合检验”**:用于判断整个模型是否有统计学意义(通常看“模型”行的显著性P值)。
* **“模型汇总”**:查看Cox & Snell R 方和Nagelkerke R 方,它们类似于线性回归中的R²,表示模型对变异的解释程度。
* **“Hosmer 和 Lemeshow 检验”**:用于检验模型拟合优度。**P > 0.05** 表示模型拟合良好。
* **“分类表”**:显示模型的预测准确率,包括敏感度、特异度和总正确率。
* **“方程中的变量”**:这是核心结果表,包含:
* **B**:回归系数。正值表示该因素是危险因素,负值表示保护因素。
* **S.E.**:标准误。
* **Wald**:Wald统计量。
* **df**:自由度。
* **Sig.**:P值,用于判断该自变量对结局的影响是否具有统计学意义(通常P < 0.05)。
* **Exp(B)**:即**比值比**。这是Logistic回归最重要的效应量指标[1]。它表示在其他变量不变的情况下,该自变量每增加一个单位(对于连续变量)或相对于参照组(对于分类变量),结局事件发生的**比值**所增加(Exp(B)>1)或减少(Exp(B)<1)的倍数。
* **Exp(B) 的 95% C.I.**:比值比的95%置信区间。如果区间不包含1,则说明该效应具有统计学意义。
### 4. 注意事项与高级应用
1. **模型假设检验**:
* **线性关系**:对于连续自变量,需检验其与logit转换后的因变量是否呈线性关系。可通过将连续变量的分箱形式与原始形式同时纳入模型进行比较,或使用**Box-Tidwell方法**检验[1]。
* **多重共线性**:自变量间不应存在高度相关性。可在“统计”选项中勾选“共线性诊断”,或在线性回归模块中检查方差膨胀因子。
2. **样本与设计**:
* **配对设计**:如果数据来自配对病例对照研究(如1:1配对),应使用**条件Logistic回归**进行分析,这在SPSS的“二元Logistic”中无法直接实现,通常需要借助其他模块或软件[1]。
* **竞争风险**:当存在多个互斥的终点事件时(如死于心血管病 vs. 死于癌症),标准Logistic回归或Cox回归可能产生偏倚,应考虑使用**竞争风险模型**[1]。
3. **其他回归模型选择**:
* 如果因变量是多分类(无序或有序),应使用**多项Logistic回归**或**有序Logistic回归**。
* 如果结局是罕见事件(发生率很低),可考虑**Poisson回归**,但其要求事件发生服从泊松分布[1]。
* 如果研究涉及时间-事件数据,则应使用**Cox比例风险回归**进行生存分析[1]。
---
**免责声明**:以上内容基于提供的文献证据进行方法学总结,旨在为临床研究设计提供参考。具体分析策略需结合研究目的、数据特征及专业统计知识进行确定,建议在专业生物统计学家指导下完成。
