Previous | Home | EndoTODAY | List | Next


[Medical statistics - 통계적 사고와 그의 도구인 통계적 기법]

벌써 6월 말입니다. 3월에 chief resident가 되신 분들, fellow가 되신 분들도 슬슬 기본 업무에 적응하고 본격적으로 연구활동을 시작할 때입니다. 연구에서 통계는 상당히 중요한 역할을 합니다. 연구 방향이나 목표를 잡는데는 별다른 역할은 없지만, 데이터 수집, 데이터 분석, 결론 도출 및 논문작성에서 통계는 빠질 수 없습니다. 통계의 기본 개념을 알고 있으면 많은 헛수고를 피할 수 있습니다.

요즘은 web을 이용하여 통계문제를 해결하곤 합니다. 대표적인 site는 StatPages.org입니다. 그러나 통계에 대한 개념이 없으면 많은 통계방법 중 무엇을 선택해야 할지 난감한 경우가 많습니다. 이럴 때에는 공부가 답입니다. 제가 10년 전쯤 통계공부를 할 때 정리해 놓은 자료가 있어 여러분께 소개합니다. 오래된 자료지만 아직 크게 변하지 않아 보입니다. 구관이 명관일 수 있습니다. 부디 도움되기 바랍니다.


들어가는 글 | 변수 | 분류 | 평균분석

상관 | 회귀 | 범주형 |생존 |Web통계

go to top 1.의학통계를 시작하기전에 고려할 점들


go to top 2.변수의 종류

  1. categorical variable (범주형) : 비연속변수, 가감승제가 불가능한 변수
  2. continuous variable (연속형)

go to top 3.분석통계의 분류

의학에서 통계분석이란 (1) 가설의 검정, (2) 모수의 추정, (3) 예후인자의 파악으로 요악할 수 있다. 평균치의 비교는 두 값간에 차이가 없다는 귀무가설을 설정하고 이를 분석함으로써 실제로 통계적으로 의미있는 차이가 있는 지를 알아내는 것이므로 가설의 검정에 해당한다. 생존률계산은 모아진 데이타로부터 알지 못하는 값을 통계적 방법으로 추측하는 것이므로 모수의 추정에 해당한다. Cox proportional hazards model은 교란변수를 통제함으로써 어떠한 변수가 환자의 생존률에 차이를 가져오는지 알아보는 과정이므로 예후인자의 파악에 해당한다. 이처럼 각각의 통계방법이 위 세가지의 과제 중 어떤 것을 수행하기 위한 방법인지를 아는 것이 전체의 개념을 파악하는 데 도움이 된다.

분석통계의 방법들은 변수의 종류에 따라 복잡하게 분류가 되지만 기본적으로 종속변수의 종류, 즉 종속변수가 연속변수인지 비연속변수인지에 따라서 크게 나누어진다. 종속변수가 연속변수인 경우의 대표적인 방법은 [t-test, 회귀, 상관]이고 종속변수가 비연속변수인 경우의 대표적인 방법은 [chi-square, logistic model]이다.

모수적 방법에는 명명한 사람의 이름을 생략하기도 한다.

  1. 평균치의 분석 (of continuous variable)

    분류 모수적 비모수적
    독립된 두 평균치의 비교 Student's t-test Mann-Witney U-test
    짝지은 두 평균치의 비교 paired t-test Wilcoxon signed rank test
    세개 이상의 평균치의 비교 ANOVA(분산분석) Kruskal-Wallis tet
    교란변수 보정법 ANCOVA Friedman's 2-way ANOVA

  2. 상관분석 (correlation of continuous variable): 선후관계가 불명확한 변수의 interdependency의 정량화
  3. 회귀분석 (regression of continuous variable): 선후관계 혹은 인과관계가 있는 독립변수와 종속변수의 dependency의 정량화
  4. 비연속 범주형변수의 분석 (교차분석)
  5. 생존분석(survival analysis)

go to top 4. 평균치의 분석

평균과 표준편차로 요약될 수 있는 연속변수(continuous variable)에 대한 자료를 검증하는 방법으로 대부분 모수적 검정법을 사용하고 있다. 그러나 (1) 표본의 크기가 워낙 작은 경우(의학에서는 보통 30 미만이지만 절대적인 기준은 아니다), (2) 분석변수가 순위척도(ordinal scale; -, +, ++, +++과 같이)인 경우, (3)분포가 지나치게 편이되어 있거나 분산이 같지 않아 정규분포를 가정할 수 없는 경우에는 비모수적검정법을 적용한다. 변수의 분포가 명백히 모수적인 조건을 만족하는 상황에서 표본수가 같으면 비모수적인 방법은 모수적인 방법에 비하여 검정력이 떨어지므로 가능하면 모수적 방법을 적용하는 것이 좋다. 그러나 표본의 수가 명확하게 모수적 방법을 적용할 만큼 충분치 않고 모수적방법과 비모수적방법의 결과가 상이할 때에는 비모수적방법의 결과를 선택하는게 일반적이다. 이는 융통성이 큰 비모수적방법이 귀무가설을 부정하고 따라서 차이가 있는 쪽(소위 positive result)으로 결론내기 쉽기 때문이다. 두 측정치가 서로 독립적이지 않은 경우에는 paired t-test, Wilcoxon signed rank test와 같이 '짝지은 자료의 분석'을 이용한다. SPSS 에서는 모수적방법과 비모수적방법은 다른 그룹으로 묶여 있다.


1) 독립된 두 평균치의 비교

독립표본 T 검정(t-test) : 가장 많이 쓰이는 검정법으로 표본의 수가 어느 정도 (보통 30 이상) 클 때 표본 평균치들로 이루어진 분포는 정규분포를 따르고 그 평균은 모평균과 같고 분산은 표준오차와 같다는 중심극한정리(central limit theorem)에 기초한 방법이다. 두 표본의 분산이 동일해야 하는데 이는 [Levene 등분산 F 검정]으로 확인할 수 있으며, 등분산이 가정되지 않는 경우(즉, Levene 등분산 F 검정에서 p-value가 0.05 이하인 경우)에는 읽어야 하는 유의 확률(p-value)이 다르고 상이한 결과가 나온다.

표본의 수가 너무 작아 (보통 30 미만) 모집단을 가정하기 어려울 때 사용하는 비모수적 검정법(이경우는 평균치 수차 자체는 이용하지 않고 순서를 이용한다)으로는 측정치를 순서대로 나열하여 번호를 매기고 순위의 합을 비교하는 Mann-Whitney U test가 대표적인다. (Wilcoxon rank sum test도 많이 쓰이는데 SPSS에는 포함되어 있지 않다.) 표본의 수가 작아 비모수적 방법을 사용하는 경우에도 비모수적인 검정법만을 시행하는 것 보다는 모수적 검정법을 먼저 시행하고 동시에 비모수적 검정법도 병행함이 귄장된다. 모수적 접근으로 통계적 유의성이 인정되지 못한다는 뜻은 다만 표본수가 작은게 원인일 수도 있기 때문이다.


2) 짝지은 두 평균치의 비교

항결핵제를 투여하기 전후의 약물농도를 비교하는 경우처럼 짝을 이룬 자료의 평균치는 두 모집단의 독립성을 인정할 수 없으므로 위의 방법을 사용할 수 없고 고유의 통계분석법을 이용해야 한다. 모수적인 방법인 paired t-test는 짝을 이룬 두 비교집단에서 개개 관측치의 차를 구하고, 그 차의 평균을 구하여 '모평균치가 0'이라는 귀무가설을 검정하는 방법이다. 비모수적인 방법인 Wilcoxon signed rank test는 각 쌍의 차들의 부호와 크기를 동시에 고려하여 검정통계량을 산출하는 방법으로 부호만을 고려하는 sign test보다 더 좋은 검정력을 가진다.


3) 세개 이상의 평균치의 비교(일원배치 분산분석법: one-way ANOVA)

세개 이상의 평균치를 비교할 때 두 집단의 비교방법인 t-test를 여러번 반복하여 판정하면 소위 overtesting이 되어 alpha-error(1종 오류:귀무가설이 옳음에도 불구하고 기각하는 오류, 즉 차이가 없음에도 불구하고 차이가 있다고 결론내리는 오류)가 증가된다. 즉 차이가 없는데도 차이가 있다고 판정내려 잘못된 positive result가 나올 수 있다. 만일 5%의 유의수준으로 하여 3번의 t-test를 했다면 t-test에 의한 판정의 오류는 5%이겠지만 전체적인 판정, 즉 3번의 판정이 동시에 가지게 되는 alpha-error는 약 14(1-(0,95)3)%가 된다. 이를 방지하기 위해서는 먼저 평균치아 아니라 분산을 가지고 비교하는 ANOVA(analysis of variance)를 시행하여 '셋 이상의 평균치들은 차이가 있는가?'(즉 같은 모집단에서 표본추출된 것인가)를 검정하고, 만약 차이가 있는 경우에는 '어느 군에서 가장 현저한가?'를 검정해야 한다. 후자를 사후검점(multiple comparison; 짝비교)이라고 하며 Duncan법, Tukey B 법이 대표적이다. 문론 전체군 비교에서 차이가 없다고 판정되면 개별군간의 비교는 필요없다.

모수적 방법인 one-way ANOVA는 (1)세가지 군이 서로 독립적이고, (2)오류없이 측정된 독립변수 값에 대한 종속변수 값의 분포는 정규분포를 따르며, (3)각 군의 분산이 같아야 한다는 세가지 가정이 성립되어야 한다. 즉 독립변수의 값들은 종속변수의 평균에 영향을 주지만 그 분산에는 영향을 주지 않는다는 전제조건이 필요하다. ANOVA는 F-분포를 따르는 F-ratio를 이용한 분석법인데 F-ratio는 표본평균치들이 가지는 분산(variance between groups, 집단간 분산, B)과 측정치들이 가지고 있는 원래의 분산(variance within groups, 집단내 분산, W)의 비이다.[F-ratio=(집단간분산/집단내 분산)]. 비모수적인 방법으로는 Kruskal-Wallis test가 있는데 이 경우에는 아직 사후검정법(multiple comparison)이 개발되어 있지 않다.

결과의 보수성: LSD < Duncan < Tukey
F값이 작이면 차이가 뚜렷하다는 의미이므로 진보적인 입장을 취하는 것도 좋으나 F 값이 크면 group간에 차이가 뚜렷하지 않다는 의미이므로 가능한 한 보수적인 입장을 취하는 것이 좋다.

Web에서 실행되는 ANOVA : ANOVA on the Web


go to top 5. 상관분석

두 변수의 선후관계가 명백하지 않아 종속관계를 정의할 수 없는 경우에 상호의존도 (interdependency)를 직선적으로 정량화하는 방법이다. 직선관계로 나타낼 수 없는 2차적 관계와 같은 복잡한 관계는 상관분석으로 해석해낼 수 가 없다. 따라서 상관분석은 우선 산점도를 그려보아서 대략적으로 직선적인 관계가 추측될 때에만 이용할 수 있다. 상관분석을 시행하면 상관계수(r)와 [모상관계수=0]이라는 귀무가설에 따른 유의확률(p-value)을 구할 수 있다. 유의확률이 작더라도 상관계수도 작으면 유의한 선형관계가 없다고 판단하는 것이 일반적이다. 상관계수(r)의 제곱(r2)을 [설명력]이라고 하는데 이는 '한 변수의 어느 정도를 다른 변수값의 변화로 설명할 수 있는가?'를 나타낸 것인데 자료의 숫자에 따라 크게 달라지므로 (자료의 수가 많을 수록 r2의 값이 커진다) 큰 의미를 줄 필요는 없다.


1) 단순상관분석 (bivariate correlation analysis)

단순상관분석을 시행할 때에는 교란변수(confounding variable)가 두 변수에 미치는 영향에 대해 주의를 기울여야 한다.

모수적 방법인 Pearson 상관계수는 관측치가 간격척도 이상의 척도(즉 간격척도와 비척도)로 측정된 자료에서 사용될 수 있다. 비모수적인 방법은 Spearman상관계수, Kendall의 타우-b 등이 있으며 보고서 작성시 추천되는 Spearman상관계수는 두 변수 X, Y 각각의 순위간에 직선적 관계가 있는지 여부를 확인하는 방법이다.


2) 편(partial)상관분석

교란변수(confounding variable)의 영향을 제외, 통제하여 상관분석을 실시하는 방법을 편상관분석이라고 한다. 통제할 변수는 1개 이상일 수 있으며 통제할 변수의 수가 편상관계수의 차수(order)가 된다. 몇개의 교란변수는 통제할 수 있는 간단한 방법이지만 교란변수의 수가 많아지면 이용할 수 없다.


go to top 6. 회귀분석

회귀분석이란 선후관계가 명백한 독립변수(설명변수라고도 함)와 종속변수(반응변수라고도 함) 간의 의존도(dependency)를 평가하는 방법이다. (1)종속변수가 독립변수에 의하여 설명되는 범위(extent), 방향(direction), 정도(strength)를 평가하고 (2)연속성 변수로 측정된 두 변수의 관계를 수학적 공식으로 함수화(예: Y = aX + b)할 수 있다. 선형회귀분석이란 두 변수의 관계가 직선적이라는 가정하에 회귀분석을 시도하는 방법으로 대부분의 회귀분석이 선형을 가정하기 때문에 일반적으로 선형(linear)이라는 단어를 앞에 생략하고 사용한다. 회귀분석은 분석을 시작하기 전에 분석자료가 직선적 관계에 있는지 확인해야 하는데 산점도에서 포물선이나 log-함수의 관계가 있다면 적절히 변환(transformation)시킨 후 회귀분석을 시행해야 한다. 일반적으로 회귀분석에서는 거리의 제곱의 합이 가장 작은 직선식을 구하게 되는데, 이를 최소제곱법(least square method)라고 한다. SPSS에서는 선형회귀분석 대화상자의 독립변수 항목에 하나의 변수만 넣으면 단순회귀분석, 두개 이상의 변수를 넣으면 다중회귀분석이 된다.


1) 단순회귀분석(simple linear regression)

종속변수를 추정하는데 사용할 독립변수의 수가 한 가지인 경우를 말하며 [Y = aX + b]와 같은 일차 함수식으로 표현된다. 단순회귀모형에는 (1) 정규성과 등분산성(X값에 관계없이 종속변수 Y의 분산이 일정), (2)독립성, (3) 선형성(linearity) 이라는 반드시 만족해야하는 세가지 기본조건이 있다. 단순회귀분석의 과정은 (1) 위의 세가지 조건에 맞는 단순선형회귀모형의 추론(모형의 선택), (2) 모형의 적합도 검정(test for goodness of fit), (3) 모형의 검토 (회귀진단)의 세단계로 이루어져 있다.

SPSS에서는 선형회귀분석을 시행하여 분산분석표에서 F-값이 유의한지 확인하고 계수표에서 상수와 B값(기울기)를 얻는다. 모형의 검토(회귀진단)를 위해서는 잔차통계량, P-P plot(정규분포를 따른다면 직성위에 점이 놓여야 한다), 표준화예측값과 표준화 잔차와의 산점도(이 두 통계량간에는 상관관계가 없어야 하므로 무질서하게 흩어져 있어야 한다)를 구해본다.


2) 다중회귀분석(multiple regression analysis)

종속변수를 설명하려는 독립변수의 수가 두가지 이상인 상황에서 회귀분석을 시도하는 방법이다. 결과는 Y = a + b1X1 + b2X2 + b3X3 + ....와 같이 표현된다. 다중회귀분석을 포함한 소위 다변량분석(multivariate analysis)에서는 포함된 변수들이 예측하기 어려운 정도로 서로 상대방 변수에 영향을 주기 때문에 몇가지 조건, 사항을 신중히 고려하면서 연구자료에 적합한 모델을 구축해야 한다.

다중회귀모델에서 '회귀모델에 독립변수로 포함되어야 하는 변수를 선정하는 방법(모델선정법: model selection)은 매우 중요하고도 어려운 문제이다. 크게 (1)선험적방법과 (2)통계적 확률에 의존하는 방법으로 나누어지는데 기존의 연구결과를 참조하고 연구자가 가지는 개인적인 경험이나 직관에 의하여 변수를 정하는 선험적인 방법이 많이 사용된다(예방의학과 유근영선생님도 이 방법을 선호한다고 하심). 즉 통계적으로 별다른 의미가 없는 결과가 나왔다고 하더라도 임상적으로, 직관적으로 꼭 들어가는 것이 좋겠다고 생각되는 변수는 넣어주는 반면, 아무리 통계적으로 유의한 수치가 나왔어도 실제로 별 의미가 없다고 판단되는 변수는 모델에서 제거하는 것이다. 통계적 확률에 의존하는 방법 중에는 모든 변수를 포함하는 입력방법(enter)과 독립변수가 아무 것도 포함되지 않은 모델로부터 출발하여 분산분석표의 F-값이 가장 큰 기여를 하는(유의 확률이 가장 작은) 변수를 순서대로 하나씩 선택하여 모델에 입력하는 단계적 선택방법(stepwise selection)이 주로 사용된다. 결국 변수의 설정에는 통계적 개념과 의학에 대한 일반적인 지식이 함께 요구되며 어느 정도의 예술적 감각도 있어야 한다.


go to top 7. 비연속 범주형 변수의 분석 (categorical data analysis) = 교차분석(crosstabs)

가감승제가 불가능한 비연속형변수간의 통계적 관련성 유무를 평가하는 분석법이다. 때로는 연속형변수도 비연속형변수로 변환하여 적합한 통계적 가설검정을 실시하기도 한다. 범주형 자료에서 가설 검정에 속하는 독립성의 검정은 chi-square에 기초를 둔 여러 검정법이 주종을 이루는데, 이는 경향분석이나 모수추정은 할 수 없다는 단점이 있다. 원칙적으로 regression을 할 수 없는 범주형 자료에서 regression을 하기 위하여 개발된 방법이 로짓모델이며 이를 이용하여 (1)LR test, (2)LR test for trend (3)모수의 추정 (multivariate linear logistic regression analysis)이 가능하다


1) two-by-two 교차분석

행(row)과 열(column)이 모두 양분성(dichotomous)인 자료는 비연속성자료의 극단적인 경우로 두개의 조건부 확률(이항분포)의 곱으로 이루어지는 복잡한 분포를 따르게 되는데, 이 조건부 확률은 수가 충분히 커지면 chi-square 분포를 근사적으로 따른다. 가장 널리 사용되는 방법이 chi-square test 이다. 그러나 비연속적인 조건부확률을 연속적인 chi-square 분포로 근사시키는 과정에서 연속성 보정(continuity correction)을 하면 그 확률이 보다 정확할 수 있다. 그러나 2 x 2 교차표의 경우에 연속성을 보정해야 하는가에 대한 통계학자들간의 의견이 일치하지 않고 있으므로 Pearson's chi-square test의 결과와 Yate's correction에 의한 방법의 결과가 다를 때에는 Fisher's exact test(2 x 2 교차표의 비모수적검사법)와 같은 직접확률계산법으로 접근함이 보다 합리적이다. 또한 4개의 cell 에 하나라도 기대도수가 5 보다 작은 숫자가 있어도 Fisher's exact test를 시행하여야 한다.

검증방법의 선택 - Prism의 설명서에서 따온 글로 매우 적절한 요약이다

odd ratio(교차비, SPSS에서는 [요인에 대한 승산비]로 표현됨)와 relative risk(상대위험도, SPSS에서는 [코호트 질병유무=환자]로 표현됨)는 서로 혼동되어 사용되는 경향이 있으나 명백히 다른 개념이고 같은 숫자로 이루어진 자료라고 하더라도 odd ratio와 relative risk는 다른 결과를 보이므로 주의해서 적용해야 한다. 즉, odd ratio는 환자대조군 연구(retrospective study)에서 적용되는 개념이고 relative risk는 코호트 연구(prospective study)에서 이용되는 개념이다. 계산방법은 복잡하지 않으나 95% 신뢰구간은 계산이 복잡하여 컴퓨터를 사용하는게 좋다.

요인, 질병
A B
C D

odd ratio = A x D / B x C
relative risk = A/(A+B) / C/(C+D)

NNT(number needed to treat); 1명의 환자에서 효과를 보기 위하여 치료해야할 환자의 수. NNT는 ARR(absolute risk reduction = C/(C+D) - A/(A+B))의 역수로 얻어진다(1/ARR). 만약 치료군에서의 사망률이 11.3% 이고 placebo군에서의 사망률이 15.9% 라고 한다면 absolute risk reduction은 4.6%가 되고 NNT는 22(1/0.046)가 된다. 즉 1명의 사망을 감소시키기 위하여 22명을 치료해야 한다는 의미이다. NTT는 치료의 득과 실을 평가하는데 유용한 정보이다. 그러나 단점은 통계학적인 분석을 통하여 유의성을 검정할 수 없다는 점이다.

Prism에서 간단하게 Fisher's exact test를 시행하는 방법

  1. SPSS에서 cross tabulation table이라고 부르는 것을 Prism에서는 contigency table이라고 부른다.
  2. create data table : X format은 text, Y format은 single Y value를 선택
  3. data 입력
  4. analyze data에서 Type은 Statistical Analyses, Contingency Tables를 선택
  5. 항상 Fisher's exact test를 선택한다. 수천 이상의 많은 수의 데이타가 입력되면 계산방법이 자동적으로 chi-square test로 전환한다. 항상 Two-tailed, 95%의 기본값을 사용한다. prospective study가 아니면 odds ratio를 사용해야 한다.


2) two-by-k 교차분석 (2 X k)

한변수는 양분성(dichotomous)이지만 나머지 한 변수가 세가지 이상의 범주로 분류되는 순위독립변수일 때 적용되는 방법으로 [위암의 보호요인으로서 자녀를 모유로 기른 기간(3개월 단위)]이 좋은 예이다. [요인에의 폭로수준이 증가함에 따라 질병 확률이 변동하는가?]라는 양-반응관계(dose-response)를 관찰하도록 노력해야 한다. 이런 가설을 Pearson's chi-square 방법으로 분석하면 dose-response에 입각한 결론을 내리기가 어려우므로 경향분석법(test for trend)을 이용한다.

two-by-k 교차분석에서 dose-response를 확인하기 위하여 [각 폭로수준에 따르는 관련도 지표로 이루어지는 직선의 기울기는 0 이다]라는 가설을 증명하는 경향분석법(test for trend)에는 (1) 순위변수의 경향분석법(score test for trend; SPSS에는 포함되어 있지 않음), (2)linear by linear association(선형 대 선형 결합)방법, (3) likelihood ratio test for trend(우도비 경향분석법: LR test for trend)가 있다. 일반적으로 score test for trend (=Armitage test)가 가장 귄장되지만 SPSS에는 포함되어 있지 않다. 대신 2 x 2 교차분석과 같이 chi-square 검정결과에 포함되어 있는 linear by linear association(선형 대 선형 결합) 방법의 결과를 근사적으로 이용한다(여기서는 cell 내의 숫자가 5 이하여도 문제가 되지 않는다는 차이점이 있다). 선형로짓모델기법을 이용한 LR test for trend은 범주형자료분석 중에서 가장 정밀도가 높은 방법이며 정확히 이해하기 위해서는 어느 정도의 이론적 지식이 필요하다. linear by linear association를 시행하여 유의한 결과를 얻지 못했을 때에도 LR test for tesnd에서는 유의한 trend가 있다고 나오는 경우가 많으므로 특히 표본의 수가 많지 않을 때 아주 유용한 방법이다. 최근 LR test for trend의 사용 빈도가 점차 증가하고 있고 많은 논문에서 이 방법을 채택하고 있으므로 어렵더라도 반드시 이해하고 넘어갸야 할 분야이다.


3) R(row)-by-C(column) 교차분석

일반적으로 3 x 4 이상의 자료는 chi-square를 시행하면 거의 의미가 없다는 결과(p가 0.05 이상)가 나온다. 만약 유의한 결과를 얻고 싶다면 표본의 숫자를 아주 크게 늘려야 한다. 그러나 이는 아주 어려우므로 몇가지 변수를 묶어서 분석한 후 논문에는 원래의 table을 그대로 보여주고 주석에 [무슨무슨 변수를 합쳐 분석했더니 유의한 차이가 있었다]는 식으로 기술하는 편법이 추천된다.

1. 독립성에 대한 검정 : 3 x 3 이상으로 요약되는 자료중에서 두 변수가 모두 순위가 없는 명칭척도(nominal scale)인 경우(이런 경우는 의학에서 많지 않다)에는 Pearson's chi-square 통계치를 이용한 독립성검정을 한다. (1) 어떤 칸의 기대치도 1보다 작아서는 안되고,(2)칸의 수의 20% 이상에서 그 기대빈도수가 5 보다 작아서는 안된다는 조건을 만족해야 한다. 만약 위의 조건을 만족하지 못하면 해당 변수의 칸을 서로 통합하여 각 칸의 기대치를 크게 한 후 통계처리를 한다.

2. 경향분석 : 의학에서 사용되는 3 x 3 이상의 자료는 대부분 ordinal scale 변수로 이루어져 있으며 통계처리는 경향분석법에서 기초해서 이루어 진다. SPSS에는 Armitage test와 같은 score test for trend가 없으므로 linear by linear association으로 근사적 접근을 시도한다. SPSS chi-square 검정결과에서 독립성검정인 chi-square의 p-value를 읽으면 negative result이나 경향분석인 linear by linear association로는 positive result가 나올 수 있으므로 즉, 통계적 차이가 있다고 나올 수 있으므로 유의해야 한다.

3. 일치도(degree of agreement) 판정 : 범주형 자료에서 시행하는 correlation이라고 생각하면 이해가 쉬운 검정법으로 행과 열의 숫자가 같아야만 분석이 가능하다. A,B 두명의 방사선과 의사에 의한 판독결과(a,b,c,d)가 서로 일치하는 지를 보는 것이 한 예이다. Kendall's tau B, gamma, kappa 등이 있으며 가장 유용한 값은 코헨의 kappa 값이다. 이는 1에 가까울수록 높은 일치도를 보인다고 해석할 수 있다.


4) 층화분석법(stratified analysis)

역학적 연구에서 주로 이용되는 방법으로 confounding variable을 category별로 층화한 상태로 chi-square를 기초로 분석하여 그 영향을 보정해 주는 우수한 방법이다. 그러나 보정해야할 변수의 수가 많아지면 매우매우 복잡해지므로 logistic model를 이용한 다변량 분석법을 이용해야 한다. 실제요 요즘은 잘 쓰이지 않고 있다.


5) multivariate linear logistic regression analysis(선형 로지스틱 모델을 이용한 다변량 회귀분석법)

층화분석법의 한계를 극복하면서 동시에 독립변수의 변환이 자유롭고, [요인-질병]간의 관계를 양적으로 표시해줄 수 있으면서, 관찰 수가 작은 층에서도 질병위험도의 예측이 가능하고, 결과를 단순하고도 즉시 해석이 가능하게 비교위험도로 제시해 줄 수 있어야 하면서, 동시에 두 가지 이상의 독립변수의 복합작용(joint effect)을 개개위험도의 곱으로 표현할 수 있도록 고안된 것이 liner logistic regresssion model이다. 결과는 [ OR=1.6, CI=0.98-2.63 ]과 같은 방법으로 기술해 주는 것이 보통이다. 로짓모델을 이용하면 비선형인 자료도 분석할 수 있으며 연속형 데이타도 처리할 수 있다. 현재 역학연구의 기본을 이루는 분석법이자 범주형 자료분석의 기본 개념을 이루는 방법이다.


go to top 8. 생존분석(survival analysis)

생존연구는 결과변수의 복잡성과 불완전한 관찰(censoring)으로 인하여 매우 복잡하며 아직 통계학적으로 해결되지 않은 문제가 많은 분야이다. 생존연구의 결과변수은 생존여부(survivorship)과 생존기간(failure time)의 두가지 복합변수로 구성되어 있으며, 실제로 연구에서는 일정시간에서의 생존여부(failure of observation)에만 관심이 있다. 연구관찰의 개시 및 종료가 다분히 인위적이기 때문에 생존여부의 확인이 불가능한 예가 반드시 발생한다. unceosored case는 사망이나 재발을 확인함으로써 추적관찰의 목적을 이룬 complete observation을 말하며 censored case는 최종적인 결과를 얻지 못하게 되는 incomplete observation을 뜻한다. censoring은 두가지 형태로 구별할 수 있다. type I censoring은 추적관찰이 종료됨으로써 관찰이 불완전해지는 경우(cut off)이다. type II censoring은 추적관찰되는 기간 중에 도중탈락(follow-up loss ; untraced)되는 경우로 random censoring이라고도 한다. 생존분석에서 이러한 censored case의 발생은 완전히 무작위적이어야 하고, 생존기간과는 독립적이어야 한다는 가정을 전제로 한다.

생존분석에서는 오직 일정시점에서의 생존여부에만 관심이 있기 때문에 cut-off에 의한 censoring과 follow-up loss에 의한 censoring을 구별하지 않는다. 따라서 생존분석에서 전체 표본 중 censoring이 차지하는 비율이나 censoring 중 follow-up loss에 의한 censoring이 차지하는 비중은 별다를 통계적 의미를 가지지 않는다. 결국 좋은 연구를 위해서는 follow-up loss가 되는 예를 최대한 줄이는 것이 좋겠지만 어느 정도 follow-up loss가 되었다고 해서 자료를 통계적으로 분석할 수 없는 것은 아니다. 일반적으로 follow-up loss의 비율은 15% 이상을 넘지 않아야 하며 20% 이상이 되면 연구결과의 신뢰성을 인정받지 못한다. 끝까지 추적되지 못한 예의 비율과 같이 생존분석에서 별다를 의미를 갖지 않는 데이타는 생존율 통계의 결과와 함께 따로 기술해 주는 것이 좋다. phase III 임상시험에서 탈락률이 양 처치군간의 효능의 차이와 비슷한 수준이면 (e.g. 두 군의 차이가 15%인데 탈락률도 15%인 경우) 그 결과는 신빙성이 없는 것으로 간주한다.

* 생존률 분석의 원칙


1) 누적 생존율의 산출 : 각 군의 생존곡선을 그리는 단계

  1. 생명표(actuarial)법

    원래 생명보험회사에서 이용하던 방법을 의학에 도입한 것으로 누적생존율을 산출하는 non-parametric 방법 중 하나이다. 관찰기간을 일정단위로 나누어 각 구간마다의 구간생존율을 구하고 이들의 누적으로 일정기간까지의 누적생존율을 구하는 방법이며 연구대상의 크기가 최소한 50표본은 넘어야 된고 관찰 단위당 10표본 이상 되는 것이 좋다.

  2. Kaplan-Meier법 (product-limit법)

    표본의 크기가 50 이하인 경우에 적용하는 방법으로, product-limit법이라는 어의에서 알 수 있듯이 일정한 간격의 구간생존율을 구하는 것이 아니라 각 사망이 일어난 시점에서의 생존율을 구하고 이들의 누적으로 누적 생존율을 산출하는 방법이다. 만약 follow-up loss(type 2 censoring)나 cut-off에 의한 관찰중단(type 1 censoring)이 사망과 동시에 일어났다면 사망이 censoring보다 먼저 발생한 거으로 간주하여 계산한다. 이해하기가 쉽고 중도탈락이나 관찰중단예에 대한 취급이 간단하여 널리 적용되고 있다.


2) 두 생존곡선의 비교 : 가설을 검정하는 단계

생명표법으로 작성된 누적생존률을 비교하는데는 Mantel-Haenszel법이 주로 사용된다. Kaplan-Meier법 (product-limit법)에 의한 누적생존률의 비교에는 두가지 방법이 가능한데 생존기간이 긴 자료에서는 log-rank법이 , 생존기간이 짧은 자료에서는 Gehan's generalized Wilcoxon 법이 주로 이용된다.

  1. Mantel-Haenszel법

    개개의 관찰구간마다 작성된 2 x 2 분할표와 chi-square 분포를 이용하여 유의성을 판단하는 방법으로 주로 생명표법에 의하여 작성된 생존율의 비교에 이용된다. 이 과정에서 censored data를 모두 제외하는데 이 때문에 통계적 검정력 (statistical efficiency)가 다른 방법에 비하여 낮아져 '유의하지 않다'라고 판정될 가능성이 높다. 또한 초기구간의 생존양상이 통계적 유의성 검정결과에 더 큰 영향을 미치게 된다. 관찰 초기에는 증례수가 많고 시간이 경과하면 증례수가 감소하므로 관찰 초기구간의 생존양상이 통계적 유의성 검정에 더 큰 영향을 미치게 되는 특징이 있다.

  2. Log-rank법

    Mantel-Haenszel법을 일반화한 것으로 관찰대상 개개인을 관찰기간 순으로 배열하고 사망이 일어난 시점에서 관찰된 사망자 수와 기대 사망자수를 산정하여 자유도가 1인 chi-square test로 그 유의성을 검정하는 방법이다. 일반적으로 Kaplan-Meier법으로 산출한 생존곡선 비교에 이용된다. 비교적 생존기간이 긴 자료이 분석에 적합하다.

  3. Gehan's generalized Wilcoxon법

    Mantel-Haenszel법과 Log-rank법이 추적관찰구간 또는 특정시점에서의 사망자의 수를 파악하여 산출한 누적 생존율을 비교,분석하는 방법임에 비하여, 일반화한 윌콕슨법은 두 비교대상 치료군에서의 생존기간의 길고 짧음을 지표로하여 비교분석하는 통계기법이다. 비교적 생존기간이 짧은 자료의 분석에 적합하다.


3) 지금까지의 결과를 그래프로 그려보자

SPSS나 SAS에서도 생존곡선을 구할 수 있으나 섬세한 조절이 어렵기 때문에 논문이나 presentation용으로는 적당하지 않다. 이때 GraphPad Prism이라는 프로그램이 가장 많이 이용된다. Prism을 이용하여 생존곡선을 그려보도록 하자.

  1. prizm program -> start a new project
  2. created data table: X format = Numbers, Y format = Single Y values
  3. X values에는 follow up duration을 Y의 data set A와 data set B에는 각 group의 결과 (0,1)을 입력한다. uncensored case (death) = 1, censored data (survival or follow-up loss) = 0
  4. Analysis data -> survival curve, Death = 1, Censored subjects = 0 하고 OK를 친다.
  5. Graph로 이동
  6. Change axes : Y는 0-1.01까지 X는 원하는 follow up duration 까지로 설정. 간격은 적당히
  7. change symbols and lines : data set A,B 모두에서 connecting line, staircase로 설정하고 error bar는 없앤다
  8. 각 line과 X-축, Y-축에 대한 이름을 넣는다.
  9. 각 요소의 색깔을 적당히 조절한다.
  10. Edit -> Copy 후 다른 프로그램에서 Paste를 누르면 결과가 삽입된다.


4) 교란변수의 영향을 보정 : 예후인자를 확인하는 단계

Cox proportional hazards model은 (1)특정 질환의 치료결과에 유의한 영향을 주는 예후인자를 규명하고, (2)이 예후인자들이 복합적으로 환자의 생존율에 미치는 영향을 상대위험도(relative risk)로 계량화할 수 있으므로 가장 많이 쓰인다. 단 (1) proportionality assumption, (2) log linearity assumption 이라는 두가지 기본 가정을 만족해야 한다.

[Home]