• (p6)  k-NN
    • k-NN을 이용한 가격 추정
      • k-NN : k-nearest neighbors
    • k-NN 가격 결정
      • k : 마지막 결과를 얻기 위해 평균을 낼 물품의 개수
    •  k=1, too small 
  • (p8) 유사도 결정하기
    • 거리 측정 
    • Euclidean 거리 사용 
  • (p10) 물품 가중치
    • 거리에 대한 가중치를 주는 방법
    • 역함수(inverse function)  num/(dist+const) Falls off too quickly
    • 물품 가중치 
      • 빼기함수 Goes to Zero 데이터마이닝 : Collective Intelligence 11
      • 가우스 함수
        • Gaussian function 
          • 거리가 0일때 1이고, 거리가 멀어지면서 가중치가 줄어듬  
  • (p14) 교차검증
    • 학습 데이터셋과 테스트 데이터셋의 구분 학습 데이터셋 테스트 데이터셋 테스트 데이터셋
  • (p17) 이질 변수 
    • 축적조정 Rescale ml by 0.1 Rescale aisle by 0.0  


Posted by Name_null