[ML] Learning Curve (데이터 늘리기, Bias 줄이기)

Notice

Recent Posts

Tags more

Archives

관리 메뉴

오답노트

Python/ML

권멋져 2022. 8. 25. 19:32

Cross Valdation을 통해서 모델 성능 편차를 줄였다면, 모델 예측에 대한 오차를 줄여야한다.

이 때 데이터를 늘리는 것으로 오차(Bias)를 줄일 수 있다.

위 그래프는 KNN 알고리즘으로 범주형 데이터를 예측했을 때 데이터의 크기와 Accuracy에 대한 관계를 나타내는 그래프이다.

데이터의 크기가 어느정도 충족되면 Accuracy가 더 이상 증가하지 않는다는 것을 보여주고 있다.

즉, 데이터가 많다고 좋은 것이 아닌 적절한 데이터의 양으로도 충분히 신뢰성이 높은 Accuracy를 얻을 수 있다.

또, Accuracy가 낮다고 판단되면 데이터를 추가하여 학습시켜 Accuracy를 다시 확인해볼 수 있다.

'Python/ML' Related Articles

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`