Метод К-средних.

· Расстояние между кластерами

 

· Значения переменных

 

· График

 

· Средние значения, дисперсия и разбиения по кластерам

ü 1 кластер

 

ü 2 кластер

 

 

ü 3 кластер

 

 

 

ü 4 кластер

 

 

ü 5 кластер

 

 

 

ü 6 кластер

 

 

 

 

Вывод: наиболее равномерное распределение по кластерам наблюдается в первом способе, но дисперсия с разы меньше во втором способе. Несмотря на, для дальнейшего анализа выберем 1 способ нормировки данных, а для уменьшения дисперсии увеличим число кластеров.

III. Кластерный анализ для лучшего варианта

Число кластеров – 8

· Расстояние между кластерами

· Значения переменных

 

 

 

· График

 

· Средние значения, дисперсия и разбиения по кластерам

ü 1 кластер

 

ü 2 кластер

 

ü 3 кластер

 

 

ü 4 кластер

 

 

ü 5 кластер

 

 

ü 6 кластер

 

 

 

ü 7 кластер

 

ü 8 кластер

 

 

Вывод: очевидно что с увеличением числа кластеров дисперсия уменьшилась, но и распределение значений по кластерам стало более неравномерным, следовательно наиболее выгодным решением было бы оставить 6 кластеров, либо провести кластерный анализ по 2 виду нормировки.