2015. 9. 28. 19:58
- (p6) k-NN
- k-NN을 이용한 가격 추정
- k-NN : k-nearest neighbors
- k-NN 가격 결정
- k : 마지막 결과를 얻기 위해 평균을 낼 물품의 개수
- k=1, too small
- (p8) 유사도 결정하기
- 거리 측정
- Euclidean 거리 사용
- (p10) 물품 가중치
- 거리에 대한 가중치를 주는 방법
- 역함수(inverse function) num/(dist+const) Falls off too quickly
- 물품 가중치
- 빼기함수 Goes to Zero 데이터마이닝 : Collective Intelligence 11
- 가우스 함수
- Gaussian function
- 거리가 0일때 1이고, 거리가 멀어지면서 가중치가 줄어듬
- (p14) 교차검증
- 학습 데이터셋과 테스트 데이터셋의 구분 학습 데이터셋 테스트 데이터셋 테스트 데이터셋
- (p17) 이질 변수
- 축적조정 Rescale ml by 0.1 Rescale aisle by 0.0
'Machine Learning & Data Mining' 카테고리의 다른 글
데이터마이닝 07-고급 분류 기법-커널 기법과 svm-01 from Kwang Woo NAM (0) | 2015.09.27 |
---|---|
데이터마이닝 06-의사결정트리-01 from Kwang Woo NAM (0) | 2015.09.27 |
데이터마이닝 05-문서필터링-02 from Kwang Woo NAM (0) | 2015.09.27 |
데이터마이닝 04-검색과 랭킹-02 from Kwang Woo NAM (0) | 2015.09.27 |
데이터마이닝 03-군집발견-03 from Kwang Woo NAM (0) | 2015.09.27 |