Myo-Kyeong Tech Blog

[AI / 데이터분석] 지도학습 - 회귀분석과 분류분석 본문

AI

[AI / 데이터분석] 지도학습 - 회귀분석과 분류분석

myo-kyeong 2023. 5. 9. 22:07
728x90
반응형

 

머신러닝의 분류

 

  • 지도 학습 ( Supervised Learning )  : 문제와 정답을 모두 알려주고 공부시키는 방법
  • 비지도 학습 ( Unsupervised Learning )  : 답을 가르쳐주지 않고 공부시키는 방법
  • 강화 학습 ( Reinforcement Learning ) : 보상을 최대화하는 방향으로 행동을 결정하고 학습하는 방법

 

https://busy.org/@urobotics/5bksow

 

 

지도학습  ( Supervised Learning ) 

 

지도학습은 정답을 알려주고 학습시키는 방법입니다. 예를 들어 위의 사진과 같이 코끼리와 기린을 분류한다고 가정한다면 코끼리 (input data) 사진은 코끼리 (label data) 임을 알려주고 학습하는 방법입니다.

지도학습은 크게 회귀 (Regression)분류 ( Classfication) 로 나뉩니다.

https://opentutorials.org/module/4916/28942

 

회귀분석  ( Regression ) 

 

 

  • 데이터들의 특징(feature)을 토대로 연속적인 값을 예측.
  • ex) 과거의 주가 데이터를 가지고 미래 주가를 예측, 자동차 배기량이나 연식 등 중고차 정보를 이용하여 가격 예측.

 

 

분류  ( Classification ) -  이진 분류 , 다중 분류

  • 종류를 예측
  • 0 또는 1 중에 선택하는 이진분류 (binary classfication) , 3개 이상의 클래스 중 하나를 선택하는 다중분류 ( multi classfication) 존재

 

이진분류 (binary classfication)

 

https://wikidocs.net/41558

  • 두가지 범주 중 하나로 분류
  • 주로, 참(True) 또는 거짓(False)을 판별하는데 사용, 출력값이 하나
  • sigmoid 함수를 이용하여 0과 1을 가공
  • ex )  스팸 메일인지 아닌지 판단, 특정 질병의 유무 판단

 

 

다중분류 (Multiclass classfication)

 

https://yhyun225.tistory.com/14

  •  타깃의 종류가 여러 개이기 때문에 출력 값도 여러개 , 각 각의 출력값은 타깃과 매칭될 확률
  •  softmax 함수를 사용
  •  one-hot encoding 기법 사용.

 

 

회귀분석 분류분석 정리 

 

구분 회귀분석 분류
이진분류 다중분류
평가지표
Loss
mse, mae
R2
Binary_Crossentropy
accuracy
Categorical_Crossentropy
accuracy
Last Layer Activation Default
(Linear)
Sigmoid Softmax
Last Layer node의 갯수 1이상 1 y레벨의 수만
Metrics mse, mae mse, mae + acc mse, mae + acc
One Hot Encoding X X O

 

 


 

REFERENCE

 

728x90
반응형