Задание № 2.9
Имеются статистические данные по 52 моделям прослушивающих и звукозаписывающих устройств по 5 показателям:
х1-цена
х2-качество звучания
х3-оснащение
х4-объем памяти
х5-вес
Требуется:
1.рассчитать матрицы корреляции и ковариации для исходных показателей;
2.рассчитать собственные значения Li;
3.определить критерий информативности для использования различного числа главных компонент;
4.определить влияние главных компонент на первый признак;
5.вычислить значение оценок относительных ошибок прогноза показателей по 1 и 2 главным компонентам;
6.определить вклад главной компоненты в процентном отношении в суммарную дисперсию;
7.для интерпретации главных компонент построить матрицу нагрузок;
8.дать содержательную интерпретацию первых двух главных компонент, используя вращение осей координат главных компонент;
9.использовать центроидный метод.
Матрица исходных данных известна из предыдущего задания.
Определим критерий информативности для использования различного числа главных компонент.
Для одной главной компоненты – 51,07% исходной информации, для двух – 77,97%, для трех – 89,04%, для четырех - 96,67%,для пяти - 100%.
Отсюда следует, что при допустимой ошибке аппроксимации, не превышающей 12-15%,возможно ограничиться лишь тремя факторами.
Определим влияние главных компонент на первый признак.
Цену (первый признак) можно выразить через 5 факторов следующим образом:
Цена = -0,85*Фактор1-0,08*Фактор2+0,18*Фактор3+0,49*Фактор4+0,07*Фактор5
График показывает вклад каждой главной компоненты на первый признак.
Вычислим значение оценок относительных ошибок прогноза показателей по 1 и 2 главным компонентам.
Определим вклад главной компоненты в процентном отношении в суммарную дисперсию.
Второй столбец в таблице показывает вклад главной компоненты в суммарную дисперсию. Вклад первой главной компоненты – 51,07%,второй – 26,9%, третьей – 11,07%, четвёртой – 7,63%,пятой – 3,33%.
Для интерпретации главных компонент построим матрицу нагрузок.
Дадим содержательную интерпретацию первых двух главных компонент, используя вращение осей координат главных компонент.
Количество переменных5
Метод: Основные компоненты
log(10) determinant of correlation matrix: -0,91804
Number of factors extracted: 2
Собственные: 2,55345 1,34507
8.1.Неповёрнутый
Варимаксимальный нормализованный
Квартимаксимальный нормализованный
Равномаксимальный нормализованный
Используем центроидный метод.
Количество переменных5
Метод: Principal factors (Centroid method)
log(10) determinant of correlation matrix: -0,91804
Number of factors extracted: 2
Собственные: 2,17469 0,968258
9.1.Неповёрнутый
Варимаксимальный нормализованный
Биквартимаксимальный нормализованный
Квартимаксимальный нормализованный