Модуль: DBSCAN: Кластеризация на основе плотности


3. Параметры DBSCAN (eps и minPts)


DBSCAN имеет только два параметра, которые нужно выбрать:

eps (epsilon): радиус окружности вокруг каждой точки. Если другая точка находится внутри этого круга — они соседи.

eps = насколько близко должны быть точки, чтобы считаться соседями

eps = 1                     eps = 3

    ╭─╮          ╭─────╮
    │ │●         │     │
    │●│          │  ●  │
    ╰─╯          │ ● ● │
                 ╰─────╯

Простыми словами: Радиус круга вокруг точки.


minPts (minimum points): минимальное количество соседей, которое должно быть у точки, чтобы считаться "ядровой" (центром кластера).

minPts = сколько соседей должно быть, чтобы точка считалась "в толпе"

minPts = 3

●  ●  ●  ●  ●          •    •

●  ●  ●  ●  ●

●  ●  ●  ●  ●          •         •

   (толпа!)                                   (одиночки)

Простыми словами: Минимальный размер толпы.

time 1000 ms
memory 256 Mb

Комментарий учителя