본문 바로가기

통계

[머신러닝] 지도학습 vs 비지도학습

안녕하세요! 

오늘은 머신러닝의 종류에 대해 알아보도록 하겠습니다.

 

머신러닝은 크게 3가지로 구분될 수 있습니다.

-지도학습

-비지도학습

-강화학습

 

오늘은 강화학습을 제외한, 지도학습과 비지도학습에 대해 간략히 보도록 할게요.

 

저는 처음에 머신러닝을 배우면서

지도학습???비지도 학습???그게 뭐야??? 정말 헷갈렸어요ㅠㅠ

지도의 의미를 'teaching'으로 받아드리면 좀 수월하실 것 같습니다.

 

지도학습은 '가르쳐준다'입니다. 

예를 들어,

집값을 예측한다고 했을 때, 

우리에게 만약 집값의 정보(종속변수=y=정답)이 있다면, 이는 지도학습입니다.

정답지가 존재할 경우, 종속변수가 범주형 자료라면 분류를, 연속형 자료라면 예측이 가능합니다!

 

비지도 학습은 '가르쳐주지 않는다'입니다.

예를 들어,

고객의 정보만 있을 때 입니다.

예측 혹은 분류하고자 하는 변수가 없고 단순히 데이터만 가지고 있을 때,

그 데이터 안에서 데이터의 분포를 보고 인사이트를 도출할 수 있습니다.

고객의 정보에서 고객을 비슷한 특성을 가진 그룹으로 묶는 것이 이에 해당합니다.

 

정리를 하면 다음과 같습니다.

 

머신러닝을 시작할 때, 

내가 '무엇을 분석하고자 하는가'는 매우 중요한 문제 입니다.

데이터의 특성에 맞게 지도학습을 할 것인지 비지도학습을 할 것인지 정하고 시작해야합니다.

 

이상입니다!

감사합니다.