오답노트

[ML] 모델링 개요 본문

Python/ML

[ML] 모델링 개요

권멋져 2022. 8. 22. 17:38

모델, 모델링

모델은 데이터로 부터 패턴을 찾아 수식으로 정리한 것이다.

모델링은 오차가 적은 모델을 만드는 과정이다.

 

목적

샘플을 가지고 전체를 추정하기위해 모델링을 한다.

 

패턴을 찾는 방법

패턴을 찾는 방법은 두 가지가 있다.

  1. 지도학습 (Supervised Learning)
  2. 비지도학습 (Unsupervised Learning)

 

지도학습

지도학습은 답을 알려주면서 패턴을 찾게하는 방식이다.

답에는 숫자형(Regression)과 범주형(Classification) 두가지가 있다.

 

비지도학습

비지도학습은 데이터 안에서 비슷한 데이터끼리 모아 패턴을 찾게하는 방식이다.

 

오차

오차는 데이터가 벗어난 정도를 나타낸다.

수식으로는 아래와 같이 나타낼 수 있다.

 

실제 값 = 모델 + 오차

 

오차를 최소화 하는 것이 모델링의 목표다.

 

관측값과 모델의 차이를 이탈도라고 한다.