2015. 4. 12. 13:58
- input: 범주형 척도 (예. 고등학교 명), ouput: 범주형 척도(예. 올해 3개 대학교 합격자 수)
- 여기서 output인 대학교는 비교 가능한 숫자가 아니다.
- 카이제곱이 크다는 것은 두 범주(=집단)간 차이가 크다는 의미 ( 분산 개념과 유사하며 두 집단간 거리가 멀다는 뜻으로 해석 가능)
- 유의 확률은 카이제곱과 반대 개념으로 카이제곱이 클수 록 작아 진다.
- 만약에 유의확률이 유의 수준(일반적으로 0.05)보다 작으면 두 집단간 차이가 있는 것으로 본다
- 이는 95%이상의 확률(1-0.05)로 두 집단간 차이가 있다고 보는 것임
- 범주형 척도가 2개 일때: T 검정
범주형 척도가 3개 이상일때: ANOVA - 매우 만족(5)~ 매우 불만족(1) 과 같은 지표는 합산, 평균등이 산출가능한 연속형 자료
- 앞의 대학교 이름(범주형자료)와는 다르다. - 반대로 고등학생 (17~19), 대학생(20~22)는 숫자를 범주화 한것으로므로 합산, 평균 등이 불가능한 범주형 자료임
- T 검정의 결과 유의 확률이 0.05(=유의수준)보다 큰 경우 두집단간 차이가 없다고 말할수 있음
T 검정의 결과 유의 확률이 0.05(=유의수준)보다 작은 경우 두집단간 차이가 있다고 말할수 있음
- ANOVA분석은 3개 이상의 범주와 연속형 자료를 가지고 서로간의 유사성을 판단하는 것
유의확률이 유의수준(0.05) 보다 작은 경우 해당 해당 집단간 차이다 있는 것
- 로지스틱스 회귀
input: 연속형 - 국가만족도, 문화관심도, 학업 성취도에 따른
output:벌 범주형- 해외여행 여부(O,X 집단 2개로 나누어짐 ) - p값이 0.05보다 작은 경우 해당 연속형 자료가 범주형(해외여행 여부)에 영향을 준다고 볼수 있음
- 국가만족도의 exp(B)= 0.85라 함은
국가만족도 편균이 3(보통)에서 4(만족)으로 1만큼 바뀔때 해외 여행자 수가 100명에서 85명으로 줄어든다는 뜻임
'Statistics' 카테고리의 다른 글
확률 통계 (펌, 한석원) (0) | 2015.04.12 |
---|---|
확률 분포 기초 (펌, 배상면) (0) | 2015.04.12 |
KOCW 강의 (0) | 2015.02.23 |
데이터베이스 (0) | 2014.12.08 |
확률과 통계 (0) | 2014.12.08 |