Алгоритм WaveCluster

WaveCluster представляет собой алгоритм кластеризации на основе волновых преобразований . В начале работы алгоритма данные обоб­щаются путем наложения на пространство данных многомерной ре­шетки. На дальнейших шагах алгоритма анализируются не отдельные точки, а обобщенные характеристики точек, попавших в одну ячейку решетки. В результате такого обобщения необходимая информация умещается в оперативной памяти. На последующих шагах для опреде­ления кластеров алгоритм применяет волновое преобразование к обоб­щенным данным.

Главные особенности WaveCluster:

1. сложность реализации;

2. алгоритм может обнаруживать кластеры произвольных форм;

3. алгоритм не чувствителен к шумам;

4. алгоритм применим только к данным низкой размерности.

Алгоритм CLARA (Clustering LARge Applications)

Алгоритм CLARA был разработан Kaufmann и Rousseeuw в 1990 году для кластеризации данных в больших базах данных. Данный алгоритм строится в статистических аналитических пакетах, например, таких, как S+,

Изложим кратко суть алгоритма. Алгоритм CLARA извлекает мно­жество образцов из базы данных. Кластеризация применяется к каждому из образцов, на выходе алгоритма предлагается лучшая кластеризация.

Для больших баз данных этот алгоритм эффективнее, чем алгоритм РАМ. Эффективность алгоритма зависит от выбранного в качестве образ­ца набора данных. Хорошая кластеризация на выбранном наборе может не дать хорошую кластеризацию на всем множестве данных.