Пусть у нас имеются данные о доходах ( x ) и спросе на некоторый товар ( y ) за ряд лет ( n ):
Год i | Доход x | Спрос y |
x 1 | y 1 | |
x 2 | y 2 | |
x 3 | y 3 | |
... | ... | ... |
n | x n | y n |
Предположим, что между x и y существует линейная взаимосвязь, т.е.
.
Для того, чтобы найти уравнение регрессии, прежде всего нужно исследовать тесноту связи между случайными величинами x и y , т.е. корреляционную зависимость.
Пусть
x 1 , x 2 , ..., x n совокупность значений независимого, факторного признака;
y 1 , y 2 , ..., y n совокупность соответствующих значений зависимого, результативного признака;
n количество наблюдений.
Для нахождения уравнения регрессии вычисляются следующие величины:
1. Средние значения
для экзогенной переменной;
для эндогенной переменной.
2. Отклонения от средних величин
, .
3. Величины дисперсии и среднего квадратичного отклонения
, ;
, .
Величины дисперсии и среднего квадратичного отклонения характеризуют разброс наблюдаемых значений вокруг среднего значения. Чем больше дисперсия, тем больше разброс.
4. Вычисление корреляционного момента (коэффициента ковариации):
.
Корреляционный момент отражает характер взаимосвязи между x и y . Если K x, y > 0, то взаимосвязь прямая. Если K x, y < 0, то взаимосвязь обратная.
5. Коэффициент корреляции вычисляется по формуле
.
Доказано, что коэффициент корреляции находится в интервале от минус единицы до плюс единицы (- 1 >= R x, y <= 1). Коэффициент корреляции в квадрате называется коэффициентом детерминации.
Если R x, y > |0,8|, то вычисления продолжаются.
6. Вычисления параметров регрессионного уравнения.
Коэффициент b находится по формуле
.
После чего можно легко найти параметр a :
.
Коэффициенты a и b находятся методом наименьших квадратов, основная идея которого состоит в том, что за меру суммарной погрешности принимается сумма квадратов разностей (остатков) между фактическими значениями результативного признака y i и его расчетными значениями y i р , полученными при помощи уравнения регрессии
.
При этом величины остатков находятся по формуле
,
где y i фактическое значение y ; y i р расчетное значение y .