오답노트
[NLP] 문서 분류 (KNN, 나이브 베이즈) 본문
KNN
분류하고자 하는 데이터와 가장 가까운 k개의 데이터와 비교하여 분류하는 방법이다.
하지만 거리 계산법에 따라 더 가까운 거리의 데이터와 비교 하므로, 실제와 다를 가능성이 있다.
나이브 베이즈
변형된 조건부 확률을 통해 가장 큰 확룰의 클래스로 분류한다.
하지만 조건부 확률은 극단적인 경우에 두 확률이 모두 0일 수 있으므로 smoothing을 통해 이러한 문제를 방지한다.
(아 귀찮아..)
'Python > DL' 카테고리의 다른 글
[NLP] 워드 임베딩 (Word Embedding)과 Word2Vec (1) | 2022.10.05 |
---|---|
[NLP] 문서 클러스터링 (0) | 2022.10.04 |
[NLP] 문서 벡터화 & 문서 유사성 (0) | 2022.10.04 |
[NLP] 규칙/패턴 기반 자연어 처리 (0) | 2022.10.04 |
[MeCab] 형태소 분석 (0) | 2022.10.03 |