[머신러닝] KNN(최근접이웃) in R
2019. 6. 15. 15:51
오늘은 KNN에 대해 알아보도록 하겠습니다. 코드는 맨 마지막에 있습니다. 이론 KNN은 K-Nearest Neighborhood의 약자로, 우리말로 최근접이웃이라고 합니다. knn 알고리즘은 이름에 그 뜻이 다 담겨 있습니다. 말그대로, k개의 이웃을 통해, 새로 들어온 데이터에 대한 라벨을 정하겠다는 뜻입니다. 예를들어, 아래와 같은 상황이 되었다고 가정해보겠습니다. 새로운 데이터(허스키)는 KNN알고리즘에 의해 어느 쪽으로 분류가 될까요?? 만약, K를 1로 정했다면,(가장 가까운 이웃 1개를 보고 라벨을 결정한다면) 새로 들어온 허스키 데이터의 변수의 값과 가장 가까운 이웃 1개를 선택하게 됩니다. 그 결과 가장 가까운 라벨은 고양이네요!! 그럼, 이번에는 보는 이웃의 개수를 더 늘려볼까요? 가장..