오답노트

[NLP] 문서 분류 (KNN, 나이브 베이즈) 본문

Python/DL

[NLP] 문서 분류 (KNN, 나이브 베이즈)

권멋져 2022. 10. 4. 21:06

KNN

분류하고자 하는 데이터와 가장 가까운 k개의 데이터와 비교하여 분류하는 방법이다.

하지만 거리 계산법에 따라 더 가까운 거리의 데이터와 비교 하므로, 실제와 다를 가능성이 있다.

 

나이브 베이즈

변형된 조건부 확률을 통해 가장 큰 확룰의 클래스로 분류한다.

하지만 조건부 확률은 극단적인 경우에 두 확률이 모두 0일 수 있으므로 smoothing을 통해 이러한 문제를 방지한다.

 

 

(아 귀찮아..)