오답노트

[ML] 범주형 데이터 모델 평가 방법 본문

Python/ML

[ML] 범주형 데이터 모델 평가 방법

권멋져 2022. 8. 23. 21:21

Confusion Matrix

Accuracy (정분류율) = (Zero Correct + One Correct) / Total * 100

Recall (재현율) = Zero Correct / (Zero Correct + Zero Incorrect) * 100

Precision (정밀도) = Zero Correct / (Zero Correct + One Incorrect) * 100

 

Accuracy (정분류율)는 전체의 경우에서 예측을 맞춘 경우의 확률이다.

Recall (재현율)은 실제 값 중에서 예측을 맞춘 경우의 확률이다.

Precision (정밀도)는 예측한 결과 중 예측이 맞은 경우의 경우의 확률이다.

 

이 세 확률은 각자 다른 관점을 가지고 바라본 것이다. 따라서 셋중에 하나를 가지고 예측을 잘했는지 못했는지 판단하기는 어렵다.

 

그래서 PrecisionRecall 의 조화 평균인  f1-score를 통해 모델을 평가한다.