Решение

1. Скопировать данные табл. 3.1 в файл STATISTICA.

2. Открыть меню«Статистика» (Statistics), в нем выбрать«Многомерные исследовательские методы» (Multidimensional research methods), далее -«Анализ кластера» (Cluster analysis).

3. В открывшемся окне (см. рис. 3.11) выбрать в качестве методы кластеризациидревовидную кластеризацию (Joining (tree clustering)).

Рис. 3.11 – Стартовая панель модуля «Кластерный анализ»

Рисунок 3.12 – Диалоговое окно иерархических агломеративных методов

Выбранное меню объединяет иерархические агломеративные методы, назначение которых состоит в классификации объектов в кластеры на основе меры сходства или расстояния. Результатом такой кластеризации является иерархическое дерево (дендрограмма).

Что касается двух других методов, заметим, что методК-средних (K-means clustering) применяется, если пользователь уже имеет представление относительно числа кластеров, на которые необходимо разбить наблюдения. Тогда метод строит ровно К различных кластеров, расположенных на возможно больших расстояниях друг от друга. Идея методаДвухвходового объединения (Two-way joining) состоит в том, чтобы одновременно классифицировать как наблюдения, так и переменные.

4. Щелкнув по кнопкеПеременные, выбрать все нормированные показатели, характеризующие деятельность предприятий.

5. В качествеКластера (Cluster) выбрать Наблюдения (строки) (Cases).

6. В строкеПравило объединения (связи) (Amalgamation (linkage) rule) выбратьМетод одиночной связи (Single Linkage), который в отечественной литературе большое известен под названием «принцип ближайшего соседа». В этом методе за расстояние между кластерами принимается расстояние между их ближайшими элементами. Правило связи строит волокнистые кластеры, т.е. кластеры, сцепленные вместе только отдельными объектами, случайно оказавшимися ближе остальных друг к другу. Результирующие кластеры имеют тенденцию быть представленными длинными цепочками.

7. В окнеМера расстояния (Distance measure) выбрать Евклидово расстояние (Eucliden distances).

8. Нажать кнопкуОК. В результате появится окно (см. рис. 3.3).

9. Выбрать опциюВертикальная древовидная диаграмма (Vertical icicle plot). В результате появится дендрограмма, изображенная на рис. 3.14.

10. Щелкнув по кнопке Схема объединения (Amalgamation schedule), получить таблицу результатов со схемой объединения (см. табл. 3.3.6), каждая строка которой показывает состав кластера на соответствующем шаге классификации.

Рисунок 3.13 – Результаты иерархической агломеративной процедуры кластеризации

Рисунок 3.14 – Вертикальная дендрограмма объединения

Таблица 3.3.6

11. ВыбратьМатрица расстояний (Distance matrix). В результате появится следующая матрица:

  1. Нажать на кнопкуОписательные статистики (Descriptive statistics), получить таблицу результатов со средними значениями (Mean) и стандартными отклонениями (Std. Dev.) для каждой переменной, используемой в описании классифицируемых объектов.