Data science/Statistics
적합도 검정 비교 (카이제곱 검정, K-S 검정)
Deepplay
2017. 6. 12. 03:19
반응형
적합도 검정이란 Goodness-of-fit 검정이라고 흔히 말하며, 데이터의 분포가 특정 분포함수와 얼마나 잘 맞는지를 검정하는 방법입니다. 가장 많이 사용하는게 정규성 검정인데, 모집단의 분포를 정규분포로 가정하고 하는 분석법, 예를 들어, t-test, anova, 회귀분석 등을 할 때, 데이터가 정규분포를 따르는가를 확인하는데 이 적합도 검정이 필요합니다.
적합도 검정에는 여러 방법이있는데 대표적인 것으로 카이제곱 검정과, Kolmogorov-Smirnov 검정이 있습니다. 카이제곱검정은 기댓값과 관측값을 이용한 방법이며, K-S 검정은 누적분포함수의 차이를 이용한 검정법입니다. 아래는 두 검정법를 비교한 표입니다.
Kolmogorov-Smirnov 검정 | 카이제곱 검정 |
연속형 데이터에 사용 가능 | 이산형 데이터에 사용가능. 연속형일 경우 그룹으로 묶어야함 |
필요한 표본 크기가 상대적으로 작음 |
표본 크기가 충분히 커야 정확도가 높음 (작으면 정확검정) |
모수를 추정해야하는 경우 정확도가 낮음 |
자유도에 모수 추정된 것이 반영됨 |
반응형