오답노트

[ML] 비지도 학습 - DBSCAN 본문

Python/ML

[ML] 비지도 학습 - DBSCAN

권멋져 2022. 8. 29. 17:49

DBSCAN

k-means 에서는  k 값을 알아야만 제대로 데이터들을 분리할 수 있었다.

하지만 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)은 k값을 몰라도 데이터를 분류해 낼 수 있다.

 

DBSCAN 절차

(출처 : http://primo.ai/index.php?title=Density-Based_Spatial_Clustering_of_Applications_with_Noise_%28DBSCAN%29)

  1. 임의의 한 점으로 부터 시작
  2. 반경 범위내에 최소 포인트 수가 존재하는지 확인
  3. 존재한다면 포인트들을 중심으로 다시 원을 그려 최소 포인트 수 확인
  4. 2~3 반복
  5. 존재하지 않으면 군집에 포함되지 않은 점으로 이동하면 1~4 반복
  6. 어느 군집에도 포함되지 않는 점은 이상치로 간주

 

반경 범위(epsilon)는 hyper parameter로 조절할 수 있다.

'Python > ML' 카테고리의 다른 글

[ML] 시계열 데이터 - 전통적 시계열 모델링  (0) 2022.08.29
[ML] 시계열 데이터  (0) 2022.08.29
[ML] 비지도 학습 - k-means  (0) 2022.08.26
[ML] Boosting - Gradient Boost  (0) 2022.08.26
[ML] 앙상블 - Boosting  (0) 2022.08.26