Статья Автор: Деникина Н.В., Деникин А.В.

Расстояние между точками

Чтобы понять, насколько похожи объекты, нам нужно измерить расстояние между ними. В машинном обучении объекты часто представлены как точки в пространстве с координатами. Существуют разные способы измерения расстояния, но начнём с самого понятного и популярного.
 

1. Евклидово расстояние (самое популярное)

Это расстояние "по прямой" между двумя точками. Помните теорему Пифагора? Это она!

\(d = \sqrt{(x_2 - x_1)^2 + (y_2 - y_1)^2}\)

Пример: Найдём расстояние между точками A(1, 2) и B(4, 6)

\(d = \sqrt{(4 - 1)^2 + (6 - 2)^2} = \sqrt{9+16} = \sqrt{25} = 5\)
 

2. Манхэттенское расстояние (расстояние такси)

Это расстояние, которое проходит такси по улицам города (только вправо-влево и вверх-вниз).

d = |x₂ - x₁| + |y₂ - y₁|

Для тех же точек A(1, 2) и B(4, 6):

d = |4-1| + |6-2| = 3 + 4 = 7

Обе метрики используются в задачах регрессии и классификации, особенно в алгоритмах K-ближайших соседей. Манхэттенское расстояние предпочтительнее евклидова при работе с данными большой размерности, поскольку евклидова метрика страдает от "проклятия размерности". В многомерных пространствах евклидово расстояние теряет различительную способность из-за роста размерности, что делает L1-норму более устойчивой для высокоразмерных данных
Печать