안녕하세요!
오늘은 머신러닝의 종류에 대해 알아보도록 하겠습니다.
머신러닝은 크게 3가지로 구분될 수 있습니다.
-지도학습
-비지도학습
-강화학습
오늘은 강화학습을 제외한, 지도학습과 비지도학습에 대해 간략히 보도록 할게요.
저는 처음에 머신러닝을 배우면서
지도학습???비지도 학습???그게 뭐야??? 정말 헷갈렸어요ㅠㅠ
지도의 의미를 'teaching'으로 받아드리면 좀 수월하실 것 같습니다.
지도학습은 '가르쳐준다'입니다.
예를 들어,
집값을 예측한다고 했을 때,
우리에게 만약 집값의 정보(종속변수=y=정답)이 있다면, 이는 지도학습입니다.
정답지가 존재할 경우, 종속변수가 범주형 자료라면 분류를, 연속형 자료라면 예측이 가능합니다!
비지도 학습은 '가르쳐주지 않는다'입니다.
예를 들어,
고객의 정보만 있을 때 입니다.
예측 혹은 분류하고자 하는 변수가 없고 단순히 데이터만 가지고 있을 때,
그 데이터 안에서 데이터의 분포를 보고 인사이트를 도출할 수 있습니다.
고객의 정보에서 고객을 비슷한 특성을 가진 그룹으로 묶는 것이 이에 해당합니다.
정리를 하면 다음과 같습니다.
머신러닝을 시작할 때,
내가 '무엇을 분석하고자 하는가'는 매우 중요한 문제 입니다.
데이터의 특성에 맞게 지도학습을 할 것인지 비지도학습을 할 것인지 정하고 시작해야합니다.
이상입니다!
감사합니다.
'통계' 카테고리의 다른 글
[머신러닝]앙상블/배깅/랜덤포레스트/부스팅 차이 (0) | 2019.06.17 |
---|---|
[빅데이터] 차원의 저주(The curse of dimensionality) (1) | 2019.06.12 |
[머신러닝]Overfitting & Underfitting(과적합과 과소적합) (0) | 2019.05.26 |
비모수적 통계 (0) | 2019.05.19 |