Модуль: DBSCAN: Кластеризация на основе плотности


2. Идея DBSCAN — кластеризация по плотности


DBSCAN — это совершенно другой способ мышления о кластерах!

Главная идея: Кластер — это ПЛОТНОЕ скопление точек. Точки, которые далеко от всех, — это ШУМ.

Аналогия: Люди на площади

Представьте большую площадь:

  • Левая часть: 20 человек стоят плотно рядом → это одна ТОЛПА
  • Правая часть: ещё 20 человек → вторая ТОЛПА
  • Посередине: несколько одиночек → это НЕ толпы, это просто люди
 
DBSCAN делает то же самое с данными: ищет ПЛОТНЫЕ скопления точек (кластеры) и отмечает одиночки как шум.

time 1000 ms
memory 256 Mb

Комментарий учителя