[머신러닝]Overfitting & Underfitting(과적합과 과소적합)
2019. 5. 26. 23:34
과적합과 과소적합에 대해 알아보도록 하겠습니다. 과적합(Overfitting)은 말 그대로 과대하게 적합되었다는 뜻입니다. 얼핏 들어보면, 학습이 잘 된거 같아서 좋은거 같은데........왜 문제가 될까요? "과적합의 문제점" 우리는 왜 빅데이터 분석을 할까요? 과거의 데이터로부터 적절한 모델을 만들어, 미래 데이터를 기반으로 예측 혹은 분류하기 위함입니다. 즉, 현재 데이터에 정확도 100% 찍는다고 해서, 미래에 들어오는 데이터를 잘 맞출 수 있다고 장담할 수 없습니다. 오히려, 현재 데이터에 너무 맞춰져있기 때문에, 미래의 데이터에 대해 더 못 맞출 수 있게됩니다. 그래서 과적합을 피하려고 하는 것입니다. 과적합을 진단하는 방법에는 무엇이 있을까요? "과적합 진단법" training data와 t..