Показатели измерения множественной линейной корреляции

Важнейшим показателем интенсивности связи в многофакторной системе является множественной коэффициент детерминации, обозначаемый заглавной латинской буквой R2.

Он измеряет общую тесноту связи вариации результативного признака с вариацией всей системы входящих в модель факторов. Другими словами он характеризует удельный вес (процент) общей дисперсии, ко­торый объясняется уравнением регрессии (или изменением факторного показателя х). Чем больше этот удельный вес, тем в большей степени вариация у объясняется изменениями комплекса пере­менных х, и, следовательно, связь между ними является более интенсивной.

Значение коэффициента детерминации изменяется от 0 до 1 и никак не указывает на направление связи.

Величина множественного коэффициента детерминации может быть вычислена несколькими способами:

а) на основе матрицы парных коэффициентов корреляции. При наличии линейной зависимости возможно определение R2 через матрицу коэффициентов корреляции, при этом формула для расчета выглядит следующим образом:

где D’ – определитель матрицы парных коэффициентов корреляции;

D – определитель матрицы межфакторной корреляции, не включающей первой строки Dr и ее последнего столбца, то есть:

б) на основе парных коэффициентов корреляции и бета коэффициентов:

в) как корреляционное отношение, то есть отношение общей вариации (общая сумма квадратов) к вариации остатков (суммы квадратов остатков).

- выровненные значения по уравнению регрессии;

yi - индивидуальное значение результативного признака;

- среднее значение результативного признака.

Математические свойства МНК таковы, что величина множественного коэффициента детерминации автоматически приближается к единице при числе факторов, приближающемся к n-1. При этом совершенно неважно, введены ли в модель реальные факторы, или любые варьирующие величины, не относящиеся к изучаемой проблеме. Чтобы исключить эту проблему из величины коэффициента детерминации, проводится его корректировка на потерю степеней свободы, получаемый показатель называется скорректированный коэффициент множественной детерминации:

На практике показатель используется для выявления наилучшей модели из числа возможных.