Определим критерий информативности для использования различного числа главных компонент

Лабораторная работа №3

х1-цена х2-качество звучания х3-оснащение

Найдем матрицы корреляции и ковариации для исходных показателей и рассчитаем собственные числа.

No. of active vars: 5 No. of supplementary vars: 0 No. of active cases: 52 No. of supplementary cases: 0  

Определим критерий информативности для использования различного числа главных компонент.

 

 

Для одной главной компоненты – 51,07% исходной информации, для двух – 77,97%, для трех – 89,04%, для четырех - 96,67%,для пяти - 100%.

Отсюда следует, что при допустимой ошибке аппроксимации, не превышающей 12-15%,возможно ограничиться лишь тремя факторами.

Определим влияние главных компонент на первый признак.

 

Цену (первый признак) можно выразить через 5 факторов следующим образом:

 

Цена = -0,85*Фактор1-0,08*Фактор2+0,18*Фактор3+0,49*Фактор4+0,07*Фактор5

 

График показывает вклад каждой главной компоненты на первый признак.

 

Вычислим значение оценок относительных ошибок прогноза показателей по 1 и 2 главным компонентам.

 

 

Определим вклад главной компоненты в процентном отношении в суммарную дисперсию.

 

 

Второй столбец в таблице показывает вклад главной компоненты в суммарную дисперсию. Вклад первой главной компоненты – 51,07%,второй – 26,9%, третьей – 11,07%, четвёртой – 7,63%,пятой – 3,33%.

 

Для интерпретации главных компонент построим матрицу нагрузок.

 

Дадим содержательную интерпретацию первых двух главных компонент, используя вращение осей координат главных компонент.

 

Количество переменных5

Метод: Основные компоненты

log(10) determinant of correlation matrix: -0,91804

Number of factors extracted: 2

Собственные: 2,55345 1,34507

 

 

8.1.Неповёрнутый

Варимаксимальный нормализованный

Квартимаксимальный нормализованный

 

Равномаксимальный нормализованный

 

 

Биквартимаксимальный нормализованный

    В ходе проведенного анализа, используя вращение осей координат главных компонент, мы получили 5 различных…

Используем центроидный метод.

Количество переменных5

Метод: Principal factors (Centroid method)

log(10) determinant of correlation matrix: -0,91804

Number of factors extracted: 2

Собственные: 2,17469 0,968258

9.1.Неповёрнутый

 

Варимаксимальный нормализованный

 

Биквартимаксимальный нормализованный

 

Квартимаксимальный нормализованный

 

Равномаксимальный нормализованный

Ни один из вариантов не является оптимальным, так как ни в одном из них второй фактор не отображает исходные данные с необходимой…   Так как при двухфакторной модели происходит недопустимо большая потеря информации (22%),то перейдем к рассмотрению…