윌콕슨 순위합 검정은 두 표본의 중위수를 비교하는데 쓰인다. 모수적 방법에서 이표본 t-test와 같다.
A, B 회사로부터 각각 생산된 계피가루 한 통의 무게를 X,Y라고 하자 n1=8, n2=8로 표본을 추출하였다.
X = {117.1, 121.3, 127.8, 121.9, 117.4, 124.5, 119.5, 115.1}
Y = {123.5, 125.3, 126.5, 127.9, 122.1, 125.6, 129.8, 117.2}
H0 : X의 중위수 = Y의 중위수 vs H1 : X의 중위수 != Y의 중위수
이 때 X, Y가 결합된 표본을 만들고 이 표본을 오름차순으로 정렬해보자.
XY = {115.1, 117.1, 117.2, 117.4, 119.5, 121.3, 121.9, 122.1, 123.5, 124.5, 125.3, 125.6, 126.5, 127.8, 127.9, 129.8}
그리고 Y 값들에 대하여 밑줄을 쳐놓고, 이 Y 값들의 순위를 모두 합쳐보자.
W = 3+8+9+11+12+13+15+16 = 87
이 때 W를 윌콕슨 통계량이라고 한다. 만약 이 W 값이 너무 작거나 너무 크면 H0를 기각할 유의한 증거가 있는 것이다. 그러면 우선 H0하에서 W의 분포를 알아야하는데, W의 정확한 분포를 알기는 매우 힘드므로 중심극한 정리를 이용한다.
우리가 알 수 있는 것은 E[W] = n2(n1+n2+1)/2, V[W] = n1n2(n1+n2+1)/12 이다. 그러므로 중심극한정리를 이용하여
W ~ N(n2(n1+n2+1)/2, n1n2(n1+n2+1)/12)
n1=8, n2=8을 이용하여 평균과 분산을 각각 구하면, 68, 90.66 이다.
위에서 구한 W 값을 표준화 시키면,
z = (87-68)/sqrt(90.66) = 1.99
양측검정에서 기각역은 z > 1.96 or z < -1.96이므로 H0를 기각한다.
'Data science > Statistics' 카테고리의 다른 글
크루스칼 왈리스 검정 (Kruskal-Wallis anova) (0) | 2017.06.10 |
---|---|
모수검정과 비모수 검정 비교표 (0) | 2017.06.10 |
윌콕슨 부호순위 검정 (Wilcoxon Signed Rank Test) (0) | 2017.06.10 |
비모수 통계학이란 무엇인가. (0) | 2017.06.10 |
회귀분석의 가정 (0) | 2017.05.20 |