오답노트

[ML] Learning Curve (데이터 늘리기, Bias 줄이기) 본문

Python/ML

[ML] Learning Curve (데이터 늘리기, Bias 줄이기)

권멋져 2022. 8. 25. 19:32

Learning Curve

Cross Valdation을 통해서 모델 성능 편차를 줄였다면, 모델 예측에 대한 오차를 줄여야한다.

이 때 데이터를 늘리는 것으로 오차(Bias)를 줄일 수 있다.

 

(출처 : https://www.geeksforgeeks.org/using-learning-curves-ml/)

 

위 그래프는 KNN 알고리즘으로 범주형 데이터를 예측했을 때 데이터의 크기와 Accuracy에 대한 관계를 나타내는 그래프이다.

 

데이터의 크기가 어느정도 충족되면 Accuracy가 더 이상 증가하지 않는다는 것을 보여주고 있다.

 

즉, 데이터가 많다고 좋은 것이 아닌 적절한 데이터의 양으로도 충분히 신뢰성이 높은 Accuracy를 얻을 수 있다.

또, Accuracy가 낮다고 판단되면 데이터를 추가하여 학습시켜 Accuracy를 다시 확인해볼 수 있다.

'Python > ML' 카테고리의 다른 글

[ML] 앙상블 - Bagging  (0) 2022.08.25
[ML] 복잡도와 과적합  (0) 2022.08.25
[ML] k-fold Cross Validation  (0) 2022.08.25
[ML] HyperParameter Tuning  (0) 2022.08.24
[ML] 선형(선형 회귀, 로지스틱 회귀) 모델 변수 선택법  (0) 2022.08.24