오답노트
[ML] 비지도 학습 - DBSCAN 본문
DBSCAN
k-means 에서는 k 값을 알아야만 제대로 데이터들을 분리할 수 있었다.
하지만 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)은 k값을 몰라도 데이터를 분류해 낼 수 있다.
DBSCAN 절차
(출처 : http://primo.ai/index.php?title=Density-Based_Spatial_Clustering_of_Applications_with_Noise_%28DBSCAN%29)
- 임의의 한 점으로 부터 시작
- 반경 범위내에 최소 포인트 수가 존재하는지 확인
- 존재한다면 포인트들을 중심으로 다시 원을 그려 최소 포인트 수 확인
- 2~3 반복
- 존재하지 않으면 군집에 포함되지 않은 점으로 이동하면 1~4 반복
- 어느 군집에도 포함되지 않는 점은 이상치로 간주
반경 범위(epsilon)는 hyper parameter로 조절할 수 있다.
'Python > ML' 카테고리의 다른 글
[ML] 시계열 데이터 - 전통적 시계열 모델링 (0) | 2022.08.29 |
---|---|
[ML] 시계열 데이터 (0) | 2022.08.29 |
[ML] 비지도 학습 - k-means (0) | 2022.08.26 |
[ML] Boosting - Gradient Boost (0) | 2022.08.26 |
[ML] 앙상블 - Boosting (0) | 2022.08.26 |