• input: 범주형 척도 (예. 고등학교 명),   ouput: 범주형 척도(예. 올해 3개 대학교 합격자 수)
    • 여기서 output인 대학교는 비교 가능한 숫자가 아니다. 
  • 카이제곱이 크다는 것은 두 범주(=집단)간 차이가 크다는 의미 ( 분산 개념과 유사하며 두 집단간 거리가 멀다는 뜻으로 해석 가능)
  • 유의 확률은 카이제곱과 반대 개념으로 카이제곱이 클수 록 작아 진다.
    • 만약에 유의확률이 유의 수준(일반적으로 0.05)보다 작으면 두 집단간 차이가 있는 것으로 본다
    • 이는 95%이상의 확률(1-0.05)로 두 집단간 차이가 있다고 보는 것임



  • 범주형 척도가 2개 일때: T 검정
    범주형 척도가 3개 이상일때: ANOVA
  • 매우 만족(5)~ 매우 불만족(1) 과 같은 지표는 합산, 평균등이 산출가능한 연속형 자료
    - 앞의 대학교 이름(범주형자료)와는 다르다.  - 반대로 고등학생 (17~19), 대학생(20~22)는 숫자를 범주화 한것으로므로 합산, 평균 등이 불가능한 범주형 자료임 
  • T 검정의 결과 유의 확률이 0.05(=유의수준)보다 큰 경우 두집단간 차이가 없다고 말할수 있음
    T 검정의 결과 유의 확률이 0.05(=유의수준)보다 작은 경우 두집단간 차이가 있다고 말할수 있음



  • ANOVA분석은 3개 이상의 범주와 연속형 자료를 가지고 서로간의 유사성을 판단하는 것
    유의확률이 유의수준(0.05) 보다 작은 경우 해당 해당 집단간 차이다 있는 것



  • 로지스틱스 회귀
    input: 연속형 - 국가만족도, 문화관심도, 학업 성취도에 따른
    output:벌 범주형- 해외여행 여부(O,X 집단 2개로 나누어짐 ) 
  • p값이 0.05보다 작은 경우 해당 연속형 자료가 범주형(해외여행 여부)에 영향을 준다고 볼수 있음
  • 국가만족도의 exp(B)= 0.85라 함은
    국가만족도 편균이 3(보통)에서 4(만족)으로 1만큼 바뀔때 해외 여행자 수가 100명에서 85명으로 줄어든다는 뜻임




'Statistics' 카테고리의 다른 글

확률 통계 (펌, 한석원)  (0) 2015.04.12
확률 분포 기초 (펌, 배상면)  (0) 2015.04.12
KOCW 강의  (0) 2015.02.23
데이터베이스  (0) 2014.12.08
확률과 통계  (0) 2014.12.08
Posted by Name_null