[머신러닝]앙상블/배깅/랜덤포레스트/부스팅 차이
2019. 6. 17. 00:48
안녕하세요! 오늘은 헷갈리는 앙상블/배깅/랜덤포레스트/부스팅 의 차이에 대해 알아보도록 하겠습니다! 앙상블 주어진 데이터를 여러개의 서로 다른 예측 모형을 생성한 후, 이러한 예측 모형의 결과를 종합하여 하나의 최종 예측 결과를 도출 데이터관점에서는, 아래와 같습니다. 빨강이냐 파랑이를 분류하는 이진분류 상황을 가정하겠습니다. 각 모델들의 예측값들이 있을 겁니다. 예측값들을 하나로 모은 다음에, 회귀가 목적이라 연속형 변수라면 평균을, 분류 문제면 다수결로 결과를 도출하는 것이 앙상블 입니다! 배깅 배갱의 뜻은 Boostrap aggregation입니다. 즉, boostrap(=복원추출 사용한 표본추출 방법)을 aggregate(통합)하는 것이죠. 그냥 붓스트랩을 여러번 해서, 여러 훈련 세트를 만들고 ..