Парная линейная регрессия

 

Следующий этап исследования корреляционной связи заключается в том, чтобы описать зависимость признака-результата от признака-фактора некоторым аналитическим выражением.

 

,

 

где − средний уровень показателя Y при данном значении x.

Если рассчитан коэффициент корреляции r , то коэффициенты a0 и a1 могут быть определены следующим образом

 

, .

В общем случае такая задача может решаться с помощью метода наименьших квадратов (МНК).

Рассмотрим использование метода наименьших квадратов для оценки параметров регрессии .

На практике имеется серия наблюдений (xi;yi) (i=1,..,n).

Будем считать, что

.

Тогда

.

Продифференцировав Q по a0 и a1 и приравняв частные производные нулю, получим следующую систему уравнений

;

,

решая которую получим оценки и

,

.

Основное назначение регрессионной модели – использование ее для прогноза экономического показателя y. Прогноз осуществляется подстановкой значения фактора в оценку детерминированной составляющей:

Чтобы определить точность этой оценки и построить доверительный интервал необходимо найти дисперсию оценки .

На практике для оценки дисперсии ошибки прогноза можно пользоваться следующим выражением

.

Из этого выражения следует, что с ростом дисперсия ошибки прогноза увеличивается.

Пример.

Исследуем зависимость розничного товарооборота магазинов (млрд р.) от среднесписочного числа работников. Обозначим:

x – число работников;

y – товарооборот.

Исходные данные и результаты расчетов приведены в таблице

Номер магазина
0,5 39,5 6 241 0,25
0,7 59,5 7 225 0,49
0,9 91,8 10 404 0,81
1,1 126,5 13 225 1,21
1,4 170,8 14 884 1,96
1,4 176,4 15 876 1,96
1,7 227,8 17 956 2,89
1,9 279,3 21 609 3,61
Итого 9,6 1171,6 107 420 13,18

 

;

; ;

;

Вычислим выборочный коэффициент корреляции:

;

;

.

 

Тогда

 

Проверим значимость выборочного коэффициента корреляции. Для этого вычислим статистику t:

 

Табличное значение критерия Стьюдента для = n-2 = 6 и

Так как 15,65 > 2,45 , то полученный коэффициент статистически значим.

Найдем коэффициенты парной линейной регрессии:

 

;

 

и регрессия имеет вид

.

Прогнозное значение розничного товарооборота при составит

 

Задание 5. С помощью корреляционного и регрессионного анализа изучить связь между показателями, указанными в Вашем варианте.

1. Рассчитать значение коэффициента корреляции для не сгруппированных данных табл. 1.

2. По данным аналитической группировки (задание 1) найти межгрупповую дисперсию признака-результата и с учетом полной дисперсии (задание 2) определить коэффициент детерминации и корреляционное отношение.

1. Сделать вывод о тесноте и форме статистической связи.

2. Найти коэффициенты парной линейной регрессии и сделать прогноз признака-результата, если признак-фактор принимает свое среднее значение.

3. На одном рисунке изобразить эмпирическую (по данным аналитической группировки) и теоретическую регрессии. Провести анализ степени их совпадения.