** alpha [변수1] [변수2]... ,std : 크론바흐 알파계수
// 변수들(평가, 설문) 간의 신뢰성 또는 일관성을 분석하는 방법
// 예) 100명의 학생이 3명의 교수 강의를 평가하는 경우
use "D:\STATA연습데이터\STATA기초통계와회귀분석\R_data5_1.dta",clear
alpha psmoke97 pdrink97 pgang97, std
/*
Test scale = mean(standardized items)
Average interitem correlation: 0.4395
Number of items in the scale: 3
Scale reliability coefficient: 0.7017
*/
// std : 각 변수들의 공분산 대신 상관계수를 이용하여 알파계수 계산
// 신뢰도 결과는 0.7 (0.8 이상이면 매우 강한 일관성, 0.6 이상이면 수용 가능한 일관성)
alpha psmoke97 pdrink97 pgang97, gen(gc) std
// gc변수 : psmoke97 pdrink97 pgang97 변수를 각각 표준화한 후 평균한 값
** kap [변수1] [변수2]... : 코헨의 카파계수
// 변수들(평가, 설문) 간의 신뢰성 또는 일관성을 분석하는 방법
// 예) 2명의 의사가 100명의 엑스레이를 보고 진단하는 경우, 3명의 면접관이 50명의 지원자를 평가하는 경우
use "D:\STATA연습데이터\STATA기초통계와회귀분석\R_data5_2.dta", clear
tab rada radb, exp // exp: 기대빈도수 표시
/*
Radiologis |
t A's | Radiologist B's assessment
assessment | Normal benign suspect cancer | Total
-----------+--------------------------------------------+----------
Normal | 21 12 0 0 | 33
| 10.9 14.8 6.2 1.2 | 33.0
-----------+--------------------------------------------+----------
benign | 4 17 1 0 | 22
| 7.2 9.8 4.1 0.8 | 22.0
-----------+--------------------------------------------+----------
suspect | 3 9 15 2 | 29
| 9.6 13.0 5.5 1.0 | 29.0
-----------+--------------------------------------------+----------
cancer | 0 0 0 1 | 1
| 0.3 0.4 0.2 0.0 | 1.0
-----------+--------------------------------------------+----------
Total | 28 38 16 3 | 85
| 28.0 38.0 16.0 3.0 | 85.0
*/
// 좌상단에서 우하단으로 부분에 관측빈도수가 모두 위치한다면 두 평가자의 판단이 일치성을 보인다고 할 수 있음
kap rada radb // 범주형 데이터로 간주
/*
Expected
Agreement agreement Kappa Std. err. Z Prob>Z
-----------------------------------------------------------------
63.53% 30.82% 0.4728 0.0694 6.81 0.0000
*/
// kapa 계수 : 0.47 (0.6~0.8 : 일치성이 매우 높음, 0.4~0.6 : 대체로 일치)
kap rada radb, wgt(w) // wgt(w) : 순서형 데이터로 간주
/*
Ratings weighted by:
1.0000 0.6667 0.3333 0.0000
0.6667 1.0000 0.6667 0.3333
0.3333 0.6667 1.0000 0.6667
0.0000 0.3333 0.6667 1.0000
Expected
Agreement agreement Kappa Std. err. Z Prob>Z
-----------------------------------------------------------------
86.67% 69.11% 0.5684 0.0788 7.22 0.0000
*/
// 범주형 데이터로 간주한 경우보다 순서형 데이터로 간주한 경우 일치성이 높게 나옴
** kappa [변수1] [변수2]...: 평가결과가 긍정/부정 두 가지만 존재하는 경우
// 2명 이상의 평가자에게 25개 문항을 질문한 경우
// subject : 문항번호, raters : 응답자 수, pos : 긍정 응답자 수
use "D:\STATA연습데이터\STATA기초통계와회귀분석\R_data5_3.dta",clear
gen neg=raters-pos // 부정 응답자 수 변수 생성
kappa pos neg
/*
Two-outcomes, multiple raters:
Kappa Z Prob>Z
-----------------------------
0.5415 5.28 0.0000
*/
// 일치성 있음
// 평가결과 범주가 3개인 경우
use "D:\STATA연습데이터\STATA기초통계와회귀분석\R_data5_4.dta", clear
kappa cat1 cat2 cat3
/*
Outcome | Kappa Z Prob>Z
-----------------+-------------------------------
cat1 | 0.2685 . .
cat2 | 0.6457 . .
cat3 | 0.2938 . .
-----------------+-------------------------------
combined | 0.3816 . .
Note: Number of ratings per subject vary; cannot calculate test
statistics.
*/
[출처] 기초통계와 회귀분석(민인식, 최필선, 2012), 한국STATA학회 홈페이지(http://kastata.org/html/sub02-04.asp)
댓글