통계적 검정의 종류
통계적 검정에 있어 p-value 를 보고 기각 여부를 판단하는 방법도 있지만, 소위 '신뢰구간이 0 을 포함하는지' 를 보고 가설검정을 할 수도 있다. 왜 신뢰구간이 0을 포함하지 않으면 두 그룹의 차이가 유의하다고 볼 수 있을까? 본 포스팅에서는 우월성 검정과 동등성 검정에 대하여 신뢰구간과 양측 가설검정이 어떤 관계를 갖고 있는지 설명한다.
1. 우월성 검정 (Superiority Test)
우월성 검정은 A가 B보다 우월함을 보이는 검정으로 일반적인 통계적 검정 (two-sample t-test) 이다. two-sample t-test 에 대한 기초내용은 이전 포스트에서 정리하였다.
H0:μ1=μ2
H0:μ1≠μ2
우월성 검정을 단측검정이 아니라 양측검정으로 하는 이유는 신뢰구간과 검정의 결과를 동일하게 맞추기 위해서이다. 예를 들어, A 약이 B 약보다 우월함을 보이고 싶을 때 검정을 통해서 구한 p-value 만 제시하는 것보다 구간 추정값을 제시하는 것이 더욱 많은 정보를 제공한다. 따라서 양측검정을 하면, 구간 추정을 통한 검정과 같은 판단을 내릴 수 있기 때문에 양측검정이 더 선호된다. 일반적으로 우월성 검정의 결과로 양측검정에 대한 p-value 와 함께 95 % 신뢰 구간을 제시된다.
양측검정과 95 % 신뢰구간이 0을 포함하는지 여부가 같은 판단을 내리는 이유
양측검정의 p-value
합동 분산을 이용한 two-sample t-test 를 예로 들어보자. p-value는 귀무가설하에서 더 극단적인 데이터를 관찰할 확률이다. 여기서 극단적인 확률이란 표본의 통계량이 대립가설을 지지하는 쪽으로 나오는 것을 말한다. 따라서 부등호의 방향이 [X > 통계량] 임을 알 수 있다. (단 통계량이 양수인 경우)
P=2P[X>˜X1−˜X2−(μ1−μ2)√s2p(1/n1+1/n2)]
X∼t(n1+n2−2)
위 식에서 p-value는 귀무가설 하에서라는 정보를 이용하면 mu_1 - mu_2 = 0 이고, 이를 통해 p-value 를 계산할 수 있다.
95% 신뢰구간
(˜X1−˜X2−t0.025√s2p(1/n1+1/n2),˜X1−˜X2+t0.025√s2p(1/n1+1/n2))
이 때, 통계량의 차이가 양수이고, 0을 포함하지 않는 경우는 구간 추정값의 left bound 가 0 보다 큰 경우인데, p-value 는 0.05 보다 작음을 알 수 있다. 통계량의 차이가 음수인 경우도 마찬가지로 right bound 가 0보다 작을 때의 p-value 가 0.05 보다 작기 때문에 동일하다. 이를 식으로 설명하면 아래와 같다.
If,˜X1−˜X2−t0.025√s2p(1/n1+1/n2)>0
P<2P[X>t0.025]=0.05
2. 동등성 검정 (equivalence test)
동등성검정은 A와 B가 의미있는 차이가 없음을 보이는 목표를 갖는 검정이다. 동등성 검정에서는 delta 라는 미리 정의된 값을 이용한다.
H0:μ1−μ2≥δ
H1:μ1−μ2<δ
동등성 검정 결과는 95 % 신뢰구간이 (-delta, delta) 안에 들어오는지 여부와 같다. 신뢰구간이 delta 사이에 들어오면 양측검정의 귀무가설을 기각할 수 있다. 왜 이렇게 되는지 아래에서 설명한다.
양측검정의 p-value
우월성검정과 비교해 부등호의 방향을 주의해야 한다.
P=2P[X<˜X1−˜X2−(δ)√s2p(1/n1+1/n2)]
X∼t(n1+n2−2)
95 % 신뢰구간
95 % 신뢰구간은 검정과 독립적으로 나오는 값이기 때문에 1. 과 같다.
(˜X1−˜X2−t0.025√s2p(1/n1+1/n2),˜X1−˜X2+t0.025√s2p(1/n1+1/n2))
만약, 위 신뢰구간의 right bound 가 delta 보다 작다면, left bound 도 자연스레 -delta 보다 클 것이다. (신뢰구간은 대칭적이기 때문에) 따라서 아래식을 가정했을 때, p-value가 0.05 보다 작음을 보이면 된다.
If,˜X1−˜X2+t0.025√s2p(1/n1+1/n2)<δ
P<2P[X<−t0.025]=2P[X>t0.025]=0.05
따라서 동등성 검정도 따로 통계량을 구하지 않고도, 신뢰구간을 통해 바로 검정할 수 있다는 것을 알 수 있다.
'Data science > Statistics' 카테고리의 다른 글
다중 비교 (Multiple comparison) 문제와 보정 방법 (0) | 2019.12.15 |
---|---|
변수 종류별 시각화 및 검정 방법 (0) | 2019.11.03 |
모분산의 추정과 검정 (2) | 2019.10.25 |
두 모집단의 모비율의 차이에 대한 검정 (2) | 2019.10.24 |
두 정규분포 모양의 모집단의 모평균의 차이에 대한 검정: Two sample t-test (0) | 2019.10.24 |