case/control 디자인에서 샘플 수를 계산하는 방법
샘플 수를 계산한다는 것의 의미
실제로 노출 여부가 case/control 여부에 영향을 줄 때, (association이 있을 때) 해당 샘플 수에서 이를 충분히 detection 할 수 있는가?
이는 다음과 같은 귀무가설/대립가설 하에서 가설 검정할 수 있습니다.
즉, Control에서 expose된 사람이랑 case에서 expose된 사람의 비율이 같은지를 검정하는 것이죠.
이를 검정하기 위해서는 p0, p1, OR을 알아야 합니다. 근데 p0, p1, OR 중에 2개를 알면 1개를 아래와 같은 식으로 구할 수 있습니다.
따라서 일반적인 샘플 수 구하는 공식처럼, 유의수준, 검정력, p0, p1 을 주고 샘플 수를 구할 수가 있습니다. 한가지 더 주어야할 것은 case/control 디자인에서는 보통 case/control의 비를 1 이상으로 맞추기 때문에 r이라고 하는 case/control ratio를 주어야합니다.
이 때, Kelsey의 공식에 따르면 필요한 case의 숫자는 아래와 같이 계산됩니다.
Kelsey의 방법
이 때, x = (p1+rp0) / (r+1) 라고 놓고, p=x(1-x) 로 계산됨
참고문헌
Kelsey J.L., Whittemore A.S., Evans A.S.,and Thompson W.D. Methods in Observational Epidemiology. Oxford University Press, 1996. Print.
http://www.openepi.com/PDFDocs/SSCCDoc.pdf
'Data science > Statistics' 카테고리의 다른 글
생존분석 - Competing Risk를 고려한 생존 분석 (3) | 2018.11.25 |
---|---|
생존분석 - 생존분석의 목적과 생존함수, 위험함수의 정의 (0) | 2018.11.01 |
벅슨의 역설 (Berkson's Paradox) (0) | 2018.08.31 |
로지스틱 회귀분석의 원리와 장점 (0) | 2018.08.30 |
Matching 데이터와 Conditional Logistic Regression (0) | 2018.08.13 |