Понятие о многофакторном корреляционно-регрессионном анализе

Для многофакторного корреляционного анализа математически задача формулируется следующим образом: требуется найти аналитическое выражение, наилучшим образом отражающее связь между факторными признаками и результативными:

у=f(x1, x2 ,. . . xn).

Наиболее сложным представляется выбор формы связи, т.к. графический метод здесь неприемлем. Можно опираться на теоретические знания, на опыт предыдущих исследований, а при отсутствии таких сведений можно определить вид связи опытным путем, т.е. путем перебора функций разных видов. Однако это сопряжено с большим количеством лишних расчетов.

Поскольку любую функцию многих переменных можно свести к линейному виду, то уравнение множественной регрессии можно искать в линейной форме:

.

В случае неадекватности линейного уравнения множественной регрессии рекомендуется повышать порядок уравнения, пока не удастся подобрать кривую, соответствующую данной статистической информации. При этом, как бы удачно не был выбран вид функции, нельзя ожидать полного соответствия расчетных ух и фактических у значений изучаемого показателя, так как уравнение множественной регрессии учитывает влияние (среднее) на результативный признак не всех, а лишь основных, существенных факторов. Действие остальных неучтенных факторов и вызывает разброс фактических значений вокруг расчетных.

С помощью многофакторного корреляционного анализа находятся различного рода характеристики тесноты связи между изучаемым показателем и факторами: парные, частные и множественные коэффициенты корреляции, множественный коэффициент детерминации.

Парные коэффициенты корреляции. Для измерения тесноты связи между двумя из рассматриваемых переменных (без учета их взаимодействия с другими переменными) применяются парные коэффициенты корреляции. Методика расчета таких коэффициентов и их интерпретация аналогичны линейному коэффициенту корреляции в случае однофакторной связи.

Частные коэффициенты корреляции. Однако в реальных условиях все переменные, как правило, взаимосвязаны. Теснота этой связи определяется частными коэффициентами корреляции, которые характеризуют степень влияния одного из аргументов на функцию при условии, что остальные независимые переменные закреплены на постоянном уровне. В зависимости от количества переменных, влияние которых исключается (элиминируется), частные коэффициенты корреляции могут быть различного порядка. При исключении влияния одной переменной получаем частный коэффициент корреляции первого порядка; при исключении влияния двух переменных – второго порядка и т. д. Парный коэффициент корреляции между функцией и аргументом обычно не равен соответствующему частному коэффициенту.

Частный коэффициент корреляции первого порядка между признаками у и х1 при исключенном влиянии признака х2 вычисляется по формуле

 

где r – парные коэффициенты корреляции между соответствующими признаками.

Совокупный коэффициент множественной корреляции. Показателем тесноты связи, устанавливаемой между результативным и двумя или более факторными признаками, является совокупный коэффициент множественной корреляции R. Он служит основным показателем линейной корреляционной связи. В случае линейной двухфакторной связи совокупный коэффициент множественной корреляции может быть рассчитан по формуле

 

где r – линейные коэффициенты корреляции (парные), а подстрочные индексы показывают, между какими признаками они исчисляются.

Совокупный коэффициент множественной корреляции измеряет одновременное влияние факторных признаков на результативный. Его значения находятся в пределах от 0 до 1. Чем меньше наблюдаемые значения изучаемого показателя отклоняются от линии множественной регрессии, тем корреляционная связь является более интенсивной, а, следовательно, величина R ближе к единице.

Совокупный коэффициент множественной детерминации. Величина R2 называется совокупным коэффициентом множественной детерминации. Она показывает, какая доля вариации изучаемого показателя объясняется влиянием факторов, включенных в уравнение множественной регрессии. Значения совокупного коэффициента множественной детерминации находятся в пределах от 0 до 1. Поэтому, чем R2 ближе к единице, тем вариация изучаемого показателя в большей мере характеризуется влиянием отобранных факторов.

Задачей многофакторного регрессионного анализа является построение уравнения множественной регрессии и нахождение неизвестных параметров а0, а1, ..., аn, выбранной функции. Параметры уравнения, как и в случае парной регрессии, находятся по способу наименьших квадратов.

Так, для расчета параметров простейшего уравнения множественной регрессии – линейной двухфакторной регрессии

 

где ух – расчетные значения результативного признака-функции;

x1 и x2– факторные признаки;

a0,a1,a2 – параметры уравнения,

строится следующая система нормальных уравнений:

;

;

.

Для получения данной системы нужно составить вспомогательную; таблицу значений: х1, х2, у, ух1, ух2, х1х2, х12, х22.

Каждый коэффициент этого уравнения, кроме а0, показывает степень влияния соответствующего фактора на анализируемый показатель (при фиксированном положении на среднем уровне остальных факторов), и все эти коэффициенты называются коэффициентами регрессии и показывают, как меняется результативный признак при изменении соответствующего факторного на 1.

Однако коэффициенты регрессии не могут сами по себе определить, какие из них оказываю: наибольшее влияние на исследуемый показатель (поскольку они измерены различными единицами), а также в развитии каких факторов заложены крупные резервы его улучшения (так как не учитывается вариация факторов).

Для этого должны быть вычислены частные коэффициенты эластичности (Эi) итак называемые βi (бета-коэффициенты).

Различия в единицах измерения факторов устраняются с помощью частных коэффициентов эластичности, которые рассчитываются по формуле

 

где ai – коэффициент регрессии при i-м факторе;

– среднее значение i-го фактора;

– среднее значение изучаемого показателя.

Частные коэффициенты эластичности показывают, на сколько процентов в среднем изменяется анализируемый показатель с измененном на 1% каждого фактора при фиксированном положении других факторов.

Для определения факторов, в развитии которых заложены наиболее крупные резервы улучшения (с точки зрения целей исследования) изучаемого показателя, необходимо учесть различия в степени варьирования вошедших в уравнение факторов. Это можно сделать с помощью βi - коэффициентов, которые вычисляются по формуле

 

где – среденее квадратическое отклонение i-го фактора;

– среденее квадратическое отклонение показателя.

βi – коэффициент показывает, на какую часть среднего квадратического отклонения изменяется результативный признак с изменением соответствующего факторного признака на величину его среднего квадратического отклонения.

Литература

 

1. Теория статистики: учебник / под ред. Р.А. Шмойловой. – М.: Финансы и статистика, 2001. – 560с.

2. Социально-экономическая статистика: учебное пособие / Н.П. Дащинская, С.С. Поухватилина, И.Е. Теслюк и др.; под ред. С.Р. Нестерович. – Мн.: БГЭУ, 2003. – 231с.

3. Экономическая статистика: Учебник /Под ред. Ю.Н.Иванова. – М.: ИНФРА-М, 1998. – 480с.

4. Статистика: курс лекций / Харченко Л.П., Долженкова В.П., Ионин В.Г. [и др.]; под ред. В.Г. Ионина. – М.: ИНФРА-М, 2002. – 384с.

5. Практикум по теории статистики: учебное пособие / под ред. Р.А. Шмойловой. – М.: Финансы и статистика, 2002. – 416с.

6. Практикум по статистике: учебное пособие для ВУЗов / под ред. В.М. Симчеры. – М.: Финстатинформ, 1999. – 259с

7. Сиденко А.В. Статистика: учебник. / А.В. Сиденко, Г.Ю. Попов, В.М. Матвеев. – М.: Дело и сервис, 2000. – 464с.