Важнейшим показателем интенсивности связи в многофакторной системе является множественной коэффициент детерминации, обозначаемый заглавной латинской буквой R2.
Он измеряет общую тесноту связи вариации результативного признака с вариацией всей системы входящих в модель факторов. Другими словами он характеризует удельный вес (процент) общей дисперсии, который объясняется уравнением регрессии (или изменением факторного показателя х). Чем больше этот удельный вес, тем в большей степени вариация у объясняется изменениями комплекса переменных х, и, следовательно, связь между ними является более интенсивной.
Значение коэффициента детерминации изменяется от 0 до 1 и никак не указывает на направление связи.
Величина множественного коэффициента детерминации может быть вычислена несколькими способами:
а) на основе матрицы парных коэффициентов корреляции. При наличии линейной зависимости возможно определение R2 через матрицу коэффициентов корреляции, при этом формула для расчета выглядит следующим образом:
где D’ – определитель матрицы парных коэффициентов корреляции;
D – определитель матрицы межфакторной корреляции, не включающей первой строки Dr и ее последнего столбца, то есть:
б) на основе парных коэффициентов корреляции и бета коэффициентов:
в) как корреляционное отношение, то есть отношение общей вариации (общая сумма квадратов) к вариации остатков (суммы квадратов остатков).
- выровненные значения по уравнению регрессии;
yi - индивидуальное значение результативного признака;
- среднее значение результативного признака.
Математические свойства МНК таковы, что величина множественного коэффициента детерминации автоматически приближается к единице при числе факторов, приближающемся к n-1. При этом совершенно неважно, введены ли в модель реальные факторы, или любые варьирующие величины, не относящиеся к изучаемой проблеме. Чтобы исключить эту проблему из величины коэффициента детерминации, проводится его корректировка на потерю степеней свободы, получаемый показатель называется скорректированный коэффициент множественной детерминации:
На практике показатель используется для выявления наилучшей модели из числа возможных.