본문 바로가기

지식창고

생존 분석 기법 - Kaplan-Meier(KM) 분석

Kaplan-Meier(KM) 생존 분석 기법

Kaplan-Meier 분석은 생존 분석(Survival Analysis)에서 사용되는 비모수적(non-parametric) 방법으로, 생존 함수(Survival Function)를 추정하는 데 사용됩니다. 주요 특징은 다음과 같습니다:

  1. 목적:
    • 특정 사건(예: 사망, 질병 발생 등)이 발생하기까지의 시간을 분석.
    • 중도 절단 데이터(censored data)를 효과적으로 처리.
  2. 방법:
    • 사건이 발생한 시점마다 생존 확률을 계산하고, 이를 누적하여 생존 곡선을 생성.
    • 생존 확률은 다음과 같은 공식으로 계산됩니다:
      $$S(t) = \prod_{t_i \leq t} \left(1 - \frac{d_i}{n_i}\right)$$
      여기서 (d_i)는 사건 발생 수, (n_i)는 해당 시점에서 생존한 사람 수입니다.
  3. 장점:
    • 중도 절단 데이터를 포함한 생존 데이터를 시각적으로 표현 가능.
    • 데이터의 분포에 대한 가정이 필요하지 않음.

Kaplan-Meier와 다른 생존 분석 기법의 차이점

 

기법 특징 차이점
Kaplan-Meier 비모수적 방법, 생존 곡선 생성. 단일 변수 분석에 적합. 다중 변수 분석 불가.
Cox 회귀 분석 반모수적(semi-parametric) 방법, 위험비(Hazard Ratio) 계산. 다중 변수 분석 가능. 변수 간 상호작용을 고려.
로그-순위 검정(Log-Rank Test) Kaplan-Meier 곡선 간의 차이를 통계적으로 검정. 생존 곡선의 차이를 비교하는 데 사용되며, 자체적으로 생존 곡선을 생성하지 않음.
파라메트릭 생존 분석 특정 분포(예: Weibull, Exponential)를 가정하여 생존 데이터를 분석. 데이터가 특정 분포를 따를 경우 더 정확한 결과 제공.

Kaplan-Meier 분석은 단순하고 직관적이지만, 다중 변수나 복잡한 상호작용을 분석하려면 Cox 회귀 분석과 같은 다른 기법이 더 적합합니다.