Определение коэффициентов интеркорреляции

 

Коэффициентами интеркорреляции являются коэффициенты корреляции между объясняющими переменными (факторами) х1, х2, …. Они позволяют исключить из модели дублирующие факторы.

Считается, что две переменные коллинеарные, т. е. находятся между собой в тесной линейной зависимости, если r xixj > 0,7. Если факторы являются коллинеарными, то они дублируют друг друга и один из них рекомендуется исключить из модели. Предпочтение при этом отдается не фактору, более тесно связанному с результатом, а тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами.

Пусть, например, при изучении зависимости у = f(x1, x2, x3) матрица парных коэффициентов корреляции оказывается следующей:

 

  у х1 х2 х3
у      
х1 0,8    
х2 0,7 0,8  
х3 0,6 0,5 0,2

 

Очевидно, что факторы х1 и х2 дублируют друг друга. В анализ целесообразно включать фактор х2, а не х1, т. к. в этом случае слабее межфакторная его корреляция с фактором х3 (r х2х3 = 0,2 < r х1х3 = 0,5). Поэтому в данном случае в уравнение включаются факторы х1 и .х3.

По величине парных коэффициентов корреляции обнаруживается лишь явная коллинеарность факторов. Наибольшие трудности во множественной регрессии возникают при наличии мультиколлинеарности факторов, когда более, чем два фактора связаны между собой тесной линейной зависимостью, т. е. имеет место совокупное воздействие факторов друг на друга. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью МНК.

Если рассматривается модель

 

 

То для расчета параметров, применяя МНК, предполагается равенство:

 

Soбщ. = Sфакт. + Sост.,

 

где Soбщ – общая сумма квадратов отклонений;

Sфакт. – факторная (объясненная) сумма квадратов отклонений;

Sост. – остаточная сумма квадратов отклонений.

В свою очередь при независимости факторов друг от друга выполнимо равенство

 

Sфакт. = Sх1 + Sх2 + Sх3,

 

где Sх1, Sх2 и Sх3 - суммы квадратов отклонений, обусловленные влиянием соответствующих факторов.

Если же факторы интеркоррелированы, то данное равенство нарушается.

Включение в модель мультиколлинеарных факторов нежелательно в силу следующих последствий:

· Затрудняется интерпретация параметров множественной модели как характеристик действия факторов в «чистом» виде, ибо факторы коррелирован; параметры регрессии теряют экономический смысл;

· Оценки параметров ненадежны, обнаруживают большие стандартные ошибки и меняются с изменением объема наблюдений (не только по величине, но и по знаку), что делает модель непригодной для анализа и прогнозирования.

Для оценки мультиколлинеарность факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами.

Если бы факторы не коррелировали между собой, то матрица парных коэффициентов корреляции между факторами была бы единичной матрицей, поскольку все недиагональные элементы были бы равны нулю.

Так, для трехфакторного уравнения матрица коэффициентов корреляции между факторами имела бы определитель, равный единице.

 

 

Если же наоборот между факторами существует полная линейная зависимость и все коэффициенты корреляции равны 1, то определитель такой матрицы равен 0.

 

 

Чем ближе к 0 определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. И наоборот.

Оценка значимости мультиколлинеарности факторов может быть проведена методом испытания гипотезы о независимости переменных Н0: Доказано, что величина имеет приближенное распределение (хи квадрат) с степенями свободы. Если фактическое значение превосходит табличное (критическое) факт. > табл.(), то гипотеза Н0 отклоняется. Это означает, что , что указывает на коллинеарность факторов. Мультиколлинеарность считается доказанной.


Лекция 7

 

Через коэффициенты множественной детерминации R2 можно найти переменные, ответственные за мультиколлинеарность факторов. Для этого в качестве зависимой переменной рассматривается каждый из факторов. Чем ближе значение R2 к 1, тем сильнее проявляется мультиколлинеарность факторов. Сравнивая между собой коэффициенты множественной детерминации (R2 х1/х2,х3,…,хр,; R2 х2/х1,х3,…,хр и т. п.) можно выделить переменные, ответственные за мультиколлинеарность, следовательно, можно решать проблему отбора факторов, оставляя в уравнении факторы с минимальной величиной коэффициента множественной детерминации.