МНОЖЕСТВЕННАЯ КОРРЕЛЯЦИЯ И ДЕТЕРМИНАЦИЯ

Для множественной регрессии рассчитываются показатели множественной и частной корреляции.

Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым результативным признаком, т. е. оценивает тесноту совместного влияния факторов на результат.

Независимо от формы связи показатель множественной корреляции может быть найден как индекс множественной корреляции:

(84)

где общая сумма квадратов отклонений результативного признака;

остаточная сумма квадратов для уравнения с полным набором факторов;

k - число переменных перед факторами.

Значение индекса множественной корреляции лежит в пределах от 0 до 1 и должно быть больше или равно максимальному парному индексу корреляции. Чем ближе его значение к 1, тем теснее связь результативного признака со всем набором исследуемых факторов.

При правильном включении факторов в регрессионный анализ величина индекса множественной корреляции будет существенно отличаться от показателя корреляции парной зависимости.

Следовательно, сравнивая показатели множественной и парной корреляции можно сделать вывод о целесообразности включения в уравнение того или иного фактора. Например: у = f(x, z); r_yxz = 0,85; R_yx = 0,82; R_yz = 0,75.

При линейной зависимости признаков показатель множественной корреляции называется линейныйкоэффициент множественной корреляции или совокупныйкоэффициенткорреляции, который может быть рассчитан по следующим формулам:

(85)

где стандартизованные коэффициенты регрессии;

парные коэффициенты корреляции результата с каждым фактором.

Возможно также при линейной зависимости определение совокупного коэффициента корреляции через матрицу парных коэффициентов корреляции:

(86)

где определитель матрицы парных коэффициентов корреляции;

определитель матрицы межфакторной корреляции.

Для уравнения определитель матрицы коэффициентов парной корреляции примет вид:

(87)

определитель более низкого порядка: образуется, когда из матрицы коэффициентов парной корреляции вычеркиваются первая строка и первый столбец:

(88)

Рассмотренная выше формула позволяет определить совокупный коэффициент корреляции, не обращаясь к уравнению множественной регрессии, а используя лишь парные коэффициенты корреляции.

Для двухфакторного линейного уравнения регрессии совокупный коэффициент корреляции определяется по выражению вида:

(89)

Индекс множественной корреляции равен совокупному коэффициенту корреляции не только при линейной зависимости признаков, но и для криволинейной зависимости, нелинейной по переменным.

Так, если для фирмы модель прибыли имеет вид

где х₁ – удельные расходы не рекламу;

х₂ – капитал фирмы;

х₃ – доля продукции фирмы в общем объеме продаж данной группы товаров по региону;

х₃ – процент увеличения объема продаж фирмы по сравнению с

предыдущим годом.

Независимо от того, что фактор х₁ задан линейно, а остальные – в логарифмах, оценка тесноты связи может быть произведена с помощью линейного коэффициента множественной корреляции.

Если, например, парные коэффициенты корреляции прибыли с каждым из ее факторов составили: r_yx₁ = -0,6; r_ylnx₂ =0,7; r_ylnx₃ =0,6; r_ylnx₄ =0,4, а уравнение в стандартизованном виде оказалось следующим:

То, используя формулу (85), получим совокупный коэффициент корреляции

Тот же результат даст и индекс множественной детерминации, определенный через соотношение остаточной и общей дисперсий (формула 84).

Иначе обстоит дело с регрессией, нелинейной по оцениваемым параметрам. В этом случае для оценки тесноты связи исследуемых признаков используется только индекс множественной корреляции

Предположим, что производственная функция имеет вид:

где Р - объем продукции; L – затраты труда; К – величин капитала; b₁ +b₂ =1.

Логарифмируя ее, получим линейное в логарифмах уравнение

Оценив параметры этого уравнения по МНК, можно определить и остаточную сумму квадратов , которая используется в расчете показателя (индекса) корреляции.

Однако, при этом нельзя забывать, что МНК применяется не к исходным данным, а к их логарифмам.

Коэффициент (или индекс) множественной детерминации оценивает качество построенной модели в целом и рассчитывается как квадрат индекса множественной корреляции или квадрат совокупного коэффициента множественной корреляции:

или (90)

Если число параметров при х_i приближается к объему наблюдений n, то для оценки качества полученной многофакторной модели используется скорректированный индекс множественной детерминации, формула расчета которого имеет вид:

(91)

где k - число параметров при переменных х;

n - число наблюдений.

Чем больше величина k, тем сильнее различия и R².

Величина показателя множественной детерминации изменяется от 0 до 1. Низкое его значение означает, что в регрессионную модель не включены существенные факторы - с одной стороны, а с другой стороны – рассматриваемая форма связи не отражает реальные соотношения между переменными, включенными в модель, и требуется ее улучшение.

Для нелинейных по параметрам моделей множественной детерминации иногда в эконометрике называют «квази – R²». Для его определения по функциям, использующим логарифмические преобразования (степенная, экспонента) применяется формула:

(92)

где k - число параметров при переменных х;

n - число наблюдений.

Лекция 9