Меры сходства

Для вычисления расстояния между объектами используются различ­ные меры сходства (меры подобия), называемые также метриками или функциями расстояний.

Для придания больших весов более отдаленным друг от друга объек­там можем воспользоваться квадратом Евклидова расстояния путем возве­дения в квадрат стандартного Евклидового расстояния.

Манхэттенское расстояние (расстояние городских кварталов), также называемое «хэмминговым» или "сити-блок" расстоянием- это расстояние рассчитывается как среднее разностей по координа­там. В большинстве случаев эта мера расстояния приводит к результатам, подобным расчетам расстояния Евклида. Однако, для этой меры влияние отдельных выбросов меньше, чем при использовании евклидового рас­стояния, поскольку здесь координаты не возводятся в квадрат.

Расстояние Чебышева: это расстояние стоит использовать, когда необходимо определить два объекта как "различные", если они отличаются по какому-то одному измерению.

Процент несогласия: это расстояние вычисляется, если данные явля­ются категориальными.