МНОЖЕСТВЕННАЯ КОРРЕЛЯЦИЯ И ДЕТЕРМИНАЦИЯ

 

Для множественной регрессии рассчитываются показатели множественной и частной корреляции.

Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым результативным признаком, т. е. оценивает тесноту совместного влияния факторов на результат.

Независимо от формы связи показатель множественной корреляции может быть найден как индекс множественной корреляции:

(84)

где общая сумма квадратов отклонений результативного признака;

остаточная сумма квадратов для уравнения с полным набором факторов;

k - число переменных перед факторами.

Значение индекса множественной корреляции лежит в пределах от 0 до 1 и должно быть больше или равно максимальному парному индексу корреляции. Чем ближе его значение к 1, тем теснее связь результативного признака со всем набором исследуемых факторов.

При правильном включении факторов в регрессионный анализ величина индекса множественной корреляции будет существенно отличаться от показателя корреляции парной зависимости.

Следовательно, сравнивая показатели множественной и парной корреляции можно сделать вывод о целесообразности включения в уравнение того или иного фактора. Например: у = f(x, z); ryxz = 0,85; Ryx = 0,82; Ryz = 0,75.

При линейной зависимости признаков показатель множественной корреляции называется линейныйкоэффициент множественной корреляции или совокупныйкоэффициенткорреляции, который может быть рассчитан по следующим формулам:

 

(85)

 

где стандартизованные коэффициенты регрессии;

парные коэффициенты корреляции результата с каждым фактором.

Возможно также при линейной зависимости определение совокупного коэффициента корреляции через матрицу парных коэффициентов корреляции:

 

(86)

 

где определитель матрицы парных коэффициентов корреляции;

определитель матрицы межфакторной корреляции.

Для уравнения определитель матрицы коэффициентов парной корреляции примет вид:

 

(87)

 

определитель более низкого порядка: образуется, когда из матрицы коэффициентов парной корреляции вычеркиваются первая строка и первый столбец:

 

(88)

 

Рассмотренная выше формула позволяет определить совокупный коэффициент корреляции, не обращаясь к уравнению множественной регрессии, а используя лишь парные коэффициенты корреляции.

Для двухфакторного линейного уравнения регрессии совокупный коэффициент корреляции определяется по выражению вида:

 

(89)

 

Индекс множественной корреляции равен совокупному коэффициенту корреляции не только при линейной зависимости признаков, но и для криволинейной зависимости, нелинейной по переменным.

Так, если для фирмы модель прибыли имеет вид

 

 

где х1 – удельные расходы не рекламу;

х2 – капитал фирмы;

х3 – доля продукции фирмы в общем объеме продаж данной группы товаров по региону;

х3 – процент увеличения объема продаж фирмы по сравнению с

предыдущим годом.

Независимо от того, что фактор х1 задан линейно, а остальные – в логарифмах, оценка тесноты связи может быть произведена с помощью линейного коэффициента множественной корреляции.

Если, например, парные коэффициенты корреляции прибыли с каждым из ее факторов составили: ryx1 = -0,6; rylnx2 =0,7; rylnx3 =0,6; rylnx4 =0,4, а уравнение в стандартизованном виде оказалось следующим:

 

То, используя формулу (85), получим совокупный коэффициент корреляции

 

 

Тот же результат даст и индекс множественной детерминации, определенный через соотношение остаточной и общей дисперсий (формула 84).

Иначе обстоит дело с регрессией, нелинейной по оцениваемым параметрам. В этом случае для оценки тесноты связи исследуемых признаков используется только индекс множественной корреляции

Предположим, что производственная функция имеет вид:

 

 

где Р - объем продукции; L – затраты труда; К – величин капитала; b1 +b2 =1.

Логарифмируя ее, получим линейное в логарифмах уравнение

 

 

Оценив параметры этого уравнения по МНК, можно определить и остаточную сумму квадратов , которая используется в расчете показателя (индекса) корреляции.

Однако, при этом нельзя забывать, что МНК применяется не к исходным данным, а к их логарифмам.

Коэффициент (или индекс) множественной детерминации оценивает качество построенной модели в целом и рассчитывается как квадрат индекса множественной корреляции или квадрат совокупного коэффициента множественной корреляции:

или (90)

Если число параметров при хi приближается к объему наблюдений n, то для оценки качества полученной многофакторной модели используется скорректированный индекс множественной детерминации, формула расчета которого имеет вид:

 

(91)

 

где k - число параметров при переменных х;

n - число наблюдений.

Чем больше величина k, тем сильнее различия и R2.

Величина показателя множественной детерминации изменяется от 0 до 1. Низкое его значение означает, что в регрессионную модель не включены существенные факторы - с одной стороны, а с другой стороны – рассматриваемая форма связи не отражает реальные соотношения между переменными, включенными в модель, и требуется ее улучшение.

Для нелинейных по параметрам моделей множественной детерминации иногда в эконометрике называют «квази – R2». Для его определения по функциям, использующим логарифмические преобразования (степенная, экспонента) применяется формула:

 

(92)

 

где k - число параметров при переменных х;

n - число наблюдений.


Лекция 9