Linearly weighted kappa 란 무엇인가?
Formula
$$ k_w = (P_0 - P_e) / (1 - P_e) $$
사용하는 이유
두 명의 측정자 (rater) 의 일치도를 평가 (inter-rater agreement) 할 때 쓰이며, 측정치가 순서가 있는 정성적 지표 (ordinal categorical variable) 일 때 쓰인다. 그냥 kappa coefficient 대신에 linearly weighted kappa 를 사용하는 이유는, 이러한 순서형 척도 변수에서 근접하게 측정된 값을 그냥 버리기 아깝기 때문에 이를 고려해서 일치도를 평가하기 위함이다.
방법
P_0 = proportion weighted observed agreement
P_e = proportion weighted chance agreement
위의 두 값을 구하면 된다. 이를 위해 우선 아래와 같은 weight matrix 를 생성한다. weight matrix는 측정치가 5개의 범주로 나누어지는 경우 아래와 같이 구할 수 있다.
두 명의 측정자의 측정치가 아래와 같다고 한다. 예를 들어, 아래 테이블은 측정자 A와 측정자 B가 동시에 1이라고 판단한 경우는 8건이고 이는 전체의 0.07 이며, 측정자 A가 1, 측정자 B 가 2라고 판단한 경우는 2건으로 전체의 0.02 임을 의미한다.
이 때, $$ P_0 = 0.07 * 1 + 0.02 * 0.75 + 0.009 * 0.5 + 0.026 * 0.75 + 0.09 * 1 ... + 0.02 * 1 = 0.93 $$ 로 구할 수 있다.
또한, $$ P_e =1 *(0.094 * 0.094) + 0.75 * (0.094 * 0.1709) + 0.50 * (0.094 * 0.530) ... + 0.02 * (0.0171*0.0171) = 0.78 $$ 로 구할 수 있다.
결국 $$ k_w = (P_0 - P_e) / (1 - P_e) = (0.93 - 0.78) / (1 - 0.78) = 0.68 $$
Reference
http://www.anestesiarianimazione.com/DWLDocuments/The%20Linearly%20Weighted%20Kappa.pdf
'Data science > Statistics' 카테고리의 다른 글
Adaptive Histogram Equalization 이란 무엇인가? (0) | 2019.06.01 |
---|---|
Histogram Equalization 이란 무엇인가? (0) | 2019.06.01 |
로지스틱 회귀분석의 최대우도추정법 직관적 이해 (0) | 2019.02.20 |
고급통계 - Net reclassification improvements (0) | 2019.01.23 |
생존분석 - 모수적 모형 (Weibull model) (0) | 2018.12.05 |