반응형
적합도 검정이란 Goodness-of-fit 검정이라고 흔히 말하며, 데이터의 분포가 특정 분포함수와 얼마나 잘 맞는지를 검정하는 방법입니다. 가장 많이 사용하는게 정규성 검정인데, 모집단의 분포를 정규분포로 가정하고 하는 분석법, 예를 들어, t-test, anova, 회귀분석 등을 할 때, 데이터가 정규분포를 따르는가를 확인하는데 이 적합도 검정이 필요합니다.
적합도 검정에는 여러 방법이있는데 대표적인 것으로 카이제곱 검정과, Kolmogorov-Smirnov 검정이 있습니다. 카이제곱검정은 기댓값과 관측값을 이용한 방법이며, K-S 검정은 누적분포함수의 차이를 이용한 검정법입니다. 아래는 두 검정법를 비교한 표입니다.
Kolmogorov-Smirnov 검정 | 카이제곱 검정 |
연속형 데이터에 사용 가능 | 이산형 데이터에 사용가능. 연속형일 경우 그룹으로 묶어야함 |
필요한 표본 크기가 상대적으로 작음 |
표본 크기가 충분히 커야 정확도가 높음 (작으면 정확검정) |
모수를 추정해야하는 경우 정확도가 낮음 |
자유도에 모수 추정된 것이 반영됨 |
반응형
'Data science > Statistics' 카테고리의 다른 글
생태학적 오류 (Ecological Fallacy) (0) | 2017.10.17 |
---|---|
임상실험(RCT)에서 나타날 수 있는 Bias (0) | 2017.06.14 |
크루스칼 왈리스 검정 (Kruskal-Wallis anova) (0) | 2017.06.10 |
모수검정과 비모수 검정 비교표 (0) | 2017.06.10 |
윌콕슨 순위합 검정(Wilcoxon rank sum test) (0) | 2017.06.10 |