Выбор формы уравнения регрессии и расчет его параметров.

 

В самом общем виде изучение корреляционной связи имеет две цели: 1) измерение параметров уравнения, выражающего связь средних значений переменной у со значениями переменной х; 2) измерение тесноты связи двух (или большего числа) признаков между собой.

Следует учитывать, что определение показателей тесноты связи является задачей корреляционного анализа. Меры тесноты связи измеряют долю вариации результативного признака, которая связана корреляционно с вариацией факторного (или факторных) признака. Показатели тесноты связи отражают роль силы действия отдельной причины в общем изменении результата.

Задачей регрессионного анализа является определение формы, направления и силы связи между изучаемыми признаками. Установление формы связи сводится к выбору и обоснованию одного из уравнений связи результативного показателя с факторным.

Направление связи отражает наличие прямой или обратной зависимости между изучаемыми признаками. Показатели силы связи отражают изменение вариации результативного показателя на одну единицу.

При осуществлении КРА выделяют следующие эго этапы:

1) оценка однородности совокупности;

2) отбор факторов, включаемых в модель;

3) выбор формы уравнения регрессии;

4) построение регрессии (определение параметров уравнения);

5) определение показателей тесноты связи;

6) оценка достоверности полученных результатов.

Для выяснения формы связи выполняется анализ зависимости результата от изменений значений каждого фактора: имеет ли она линейный или нелинейный характер. Если факторы, входящие в изучаемый комплекс, имеют разные формы взаимодействия с результатом, их необходимо привести к единой, типичной и логически наиболее оправданной форме, например, к линейной. При этом приходится мириться с некоторой неточностью отражения формы связи с избранным управлением регрессии ради содержательной интерпретации результатов и более простого способа их получения.

Рассмотрим наиболее часто используемые уравнения регрессии в наиболее простом случае – когда рассматривается взаимосвязь между двумя признаками х и у.

1. Если с увеличением факторного признака (х) результативный признак (у) равномерно возрастает или убывает, то зависимость является линейной и описывается уравнением прямой:

где - среднее значение результативного признака при определение значении факторного признака х;

а0 – свободный член уравнения регрессии;

а1 – коэффициент регрессии, отражающий вариацию результативного показателя, приходящуюся на единицу вариации факторного показателя (это показатель силы связи).

Решение задачи нахождения параметров уравнения регрессии осуществляется с помощью метода наименьших квадратов, который состоит в минимизации суммы квадратов отклонений фактических значений переменной у от ее значений, вычисленных по уравнению регрессии:

где уi – фактическое значение переменной у.

Для нахождения параметров управления регрессии достаточно решить систему нормальных уравнений:

2. Если связь между признаками нелинейная, и с возрастанием факторного признака происходит ускоренное возрастание или убывание результативного признака, то используется уравнение параболы второго порядка

Для определения его параметров решают систему трех уравнений с тремя неизвестными:

3. Если результативный признак с увеличением факторного возрастает или убывает не бесконечно, а стремится к какому-то пределу, то связь описывается уравнением гиперболы:

4. Если связь нелинейная и слабая, то связь между признаками описывается уравнениями степенной функции:

или lg y = lg a0 + a1 lg x.

5. Если при увеличении значений признака х в арифметический прогрессии значения результативного показателя изменяются в геометрической прогрессии, то связь может быть описана уравнением показательной функции:

или lg y = lg a0 + x lg a1.

Однозначно проследить характер взаимодействия между признаками чаще всего не представляется возможным визуально. Поэтому реализуется исчисление параметров уравнений регрессии различных видов. Затем с помощью различных критериев отбирают ту форму уравнения регрессии, которая наиболее точно отражает реально существенную зависимость. Одним из таких критериев является средний коэффициент аппроксимации, который дает обобщенную количественную характеристику относительных размеров отклонения фактических значений результата (уi) от теоретических , полученных по построенному уравнению регрессии:

Этот коэффициент определяет среднюю величину относительного отклонения фактического значения от расчетного.

Если ≤ 6 – 8 %, то указывают на хорошую степень приближения расчетных значений к фактическим, т.е. выбранная форма уравнения связи и состав отобранных факторов достаточно точно отражают реальные зависимости. При от 9 до 15 % говорят о средней степени приближения расчетных значений к фактическим и о средним качестве избранной формы связи. Если значения ≥ 16 – 20 %, считается, что уравнение регрессии неточно описывает форму зависимости.

Рассмотрим смысл показателей регрессии на примере простейшей системы корреляционной связи – линейной связи между двумя признаками. Уравнение парной регрессии:

О направлении связи можно судить по знаку при коэффициенте регрессии. Если увеличение х приводит к увеличению , то а1 > 0 и связь называется прямой. Если же при увеличении х значение уменьшается, то а1 < 0 и связь называется обратной. Коэффициент регрессии1) имеет смысл показателя силы связи между вариацией факторного признака х и вариацией результативного признака у. Он показывает среднее по совокупности отклонение у от его средней величины при отклонении х от своей средней величины на принятую для х единицу измерения.

Свободный член уравнения регрессии а0 показывает среднее значение результативного признака при х = 0.

Считается, что если знак перед а0 отрицательный, то область существования признака у не включает нулевого значения признака х и близких значений. Можно рассчитать минимально возможную величину фактора х, при которой обеспечивается наименьшее значение признака: хmin = Если же область существования результативного признака включает нулевое значение признака-фактора, то свободный член является положительным и означает среднее значение результативного показателя при отсутствии данного фактора х.

Кроме коэффициента регрессии к показателям силы связи относят коэффициенты эластичности (Э) и бетта-коэффициенты (β). Коэффициенты эластичности могут быть исчислены как:

где а1 – коэффициент регрессии;

и - средние значения факторного и результативного показателей.

Коэффициент эластичности показывает, на сколько процентов отклонится результативный показатель от своего среднего значения при отклонении величины фактора от его среднего значения на 1 %.

бетта-коэффициент:

где σх и σу – среднеквадратическое отклонения по факторному и результативному показателям.

Бетта-коэффициент показывает, на какую часть своего среднего квадратического значения изменится у при изменении х не величину его среднеквадратического отклонения.

Два последних показателя (Э, β) в отличие от коэффициентов регрессии, значения которых по различным факторам несопоставимы, позволяют сравнивать силу влияния различных факторов на результативный показатель.