오답노트
[ML] Learning Curve (데이터 늘리기, Bias 줄이기) 본문
Learning Curve
Cross Valdation을 통해서 모델 성능 편차를 줄였다면, 모델 예측에 대한 오차를 줄여야한다.
이 때 데이터를 늘리는 것으로 오차(Bias)를 줄일 수 있다.
(출처 : https://www.geeksforgeeks.org/using-learning-curves-ml/)
위 그래프는 KNN 알고리즘으로 범주형 데이터를 예측했을 때 데이터의 크기와 Accuracy에 대한 관계를 나타내는 그래프이다.
데이터의 크기가 어느정도 충족되면 Accuracy가 더 이상 증가하지 않는다는 것을 보여주고 있다.
즉, 데이터가 많다고 좋은 것이 아닌 적절한 데이터의 양으로도 충분히 신뢰성이 높은 Accuracy를 얻을 수 있다.
또, Accuracy가 낮다고 판단되면 데이터를 추가하여 학습시켜 Accuracy를 다시 확인해볼 수 있다.
'Python > ML' 카테고리의 다른 글
[ML] 앙상블 - Bagging (0) | 2022.08.25 |
---|---|
[ML] 복잡도와 과적합 (0) | 2022.08.25 |
[ML] k-fold Cross Validation (0) | 2022.08.25 |
[ML] HyperParameter Tuning (0) | 2022.08.24 |
[ML] 선형(선형 회귀, 로지스틱 회귀) 모델 변수 선택법 (0) | 2022.08.24 |