Реферат Курсовая Конспект
Курс лекций по дисциплине Эконометрика. В последнее время специалисты - раздел Экономика, Курс Лекций По Дисциплине «Эконометрика»[1]...
|
Курс лекций по дисциплине «Эконометрика»[1]
Введение
В последнее время специалисты, обладающие знаниями и навыками проведения прикладного экономического анализа с использованием доступных математических и программных средств, пользуются спросом на рынке труда. Одной из центральных дисциплин в подготовке таких специалистов является дисциплина "Эконометрика".
Эконометрика является областью знаний, которая охватывает вопросы применения статистических методов к теоретическим моделям, описывающим реальные экономические процессы.
Очевидно, что с помощью моделей можно получить много информации об экономических процессах, объяснить те или иные явления или процессы, но никогда не удастся получить всю информацию и однозначно определить истинный механизм экономического процесса или явления.
И даже в тех случаях, когда достаточно адекватная исходным данным эконометрическая модель построена и вопрос только в использовании ее для объяснения экономической ситуации или принятия решения, следует весьма осторожно подходить к выводам и рекомендациям, следующим из модельных оценок.
Эконометрический анализ, как правило, проводят с помощью ПЭВМ. В последние несколько лет сформировался обширный набор из пакетов прикладных программ, позволяющих автоматизировать процессы такого анализа. К наиболее распространенным относятся пакеты SAS, SPSS, Stata, Eviews и др. Имеются простейшие опции для проведения эконометрического анализа в Excel.
В настоящем пособии даются основные понятия, модели и методы эконометрики, рассматриваются примеры.
Содержание пособия полностью соответствует требованиям государственного стандарта высшего профессионального образования за исключением темы "Системы одновременных уравнений".
Для работы с предлагаемым изданием необходимы базовые знания некоторых разделов следующих учебных дисциплин: высшая математика, теория вероятностей, математическая статистика, общая теория статистики.
Эффективным является использование данной книги в сочетании с самостоятельным разбором примеров с использованием доступного статистического программного обеспечения.
1. Предмет и задачи дисциплины "Эконометрика"
1.1. Определение эконометрики
Сложность экономических процессов и необходимость их количественного измерения не позволяют современному экономисту ограничиваться в своей работе применением инструментов отдельных экономических дисциплин. Так, например, невозможно сделать прогноз о том, будет ли пользоваться спросом новый продукт (сорт кофе), если рассматривать этот процесс только с точки зрения экономической теории, то есть закона спроса и предложения. На практике для осуществления прогноза экономисту необходимо применить целый комплекс экономических наук, синтез которых и является сутью научной дисциплины - эконометрики.
Основной цельюэконометрики является модельное описание конкретных количественных взаимосвязей, обусловленных общими качественными закономерностями, изученными в экономической теории.
Эконометрика – относительно молодая научная дисциплина, сформировавшаяся во второй половине ХХ века и развивающаяся на стыке экономической теории, статистики и математики (см. рис. 1.1).
Рис. 1.1. Эконометрика и ее место в ряду других экономических
и статистических дисциплин
Впервые термин эконометрика был введен норвежским ученым Рагнаром Фришем в 1926 году и в буквальном переводе означает «измерение в экономике». Однако на сегодняшний день эта трактовка чересчур широка. Более четко определение эконометрики предложено известным российским ученым, профессором С.А. Айвазяном.
Эконометрика - это самостоятельная научная дисциплина, объединяющая совокупность теоретических результатов, приемов, методов и моделей, предназначенных для того, чтобы на базе - экономической теории, - экономической статистики, - математико-статистического инструментария придавать конкретное количественное выражение общим качественным закономерностям, обусловленным экономической теорией. |
Таким образом, суть эконометрики состоит в синтезеэкономической теории, экономической статистики и математико-статистического инструментария.
Парная регрессия
Таблица 2.1
Индивидуальное потребление и личные доходы (США, 1954-1965 гг.)
Год | Индивидуальное потребление, млрд. долл. | Личные доходы, млрд. долл. |
Заметим, что исходные данные должны быть выражены величинами примерно одного порядка. Вычисления удобно организовать, как показано в таблице 2.2. Сначала рассчитываются , затем xi, yi. Результаты заносятся в столбцы 3 и 4. Далее определяются xi2, xiyi и заносятся в 5 и 6 столбцы таблицы 2.2. По формулам (2.8) получим искомые значения параметров =43145/46510=0,9276; =321,75-0,9276.350=-2,91.
Оцененное уравнение регрессии запишется в виде =-2,91+0,9276X.
Следующая важная проблема состоит в том, чтобы определить, насколько "хороши" полученные оценки и уравнение регрессии. Этот вопрос рассматривается по следующим стадиям исследования: квалифицирование (выяснение условий применимости результатов), определение качества оценок, проверка выполнения допущений метода наименьших квадратов.
Относительно квалифицирования уравнения =-2,91+0,9276X. Оно выражает, конечно, достаточно сильное утверждение. Применять это уравнение для прогнозирования следует очень осторожно. Дело в том, что, даже отвлекаясь от многих факторов, влияющих на потребление, и от систематического изменения дохода по мере варьирования потребления, мы не располагаем достаточно представительной выборкой.
Таблица 2.2
Рабочая таблица расчетов (по данным табл. 2.1)
Год | X | Y | x | y | x2 | xy | ei | |
-93 | -85,75 | 7974,75 | 235,48 | 0,52 | ||||
-75 | -67,75 | 5081,25 | 252,18 | 1,82 | ||||
-57 | -54,75 | 3120,75 | 268,88 | -1,88 | ||||
-41 | -40,75 | 1670,75 | 283,72 | -2,72 | ||||
-31 | -31,75 | 984,25 | 292,99 | -2,99 | ||||
-13 | -10,75 | 139,75 | 309,69 | 1,31 | ||||
3,25 | 321,75 | 3,25 | ||||||
13,25 | 185,5 | 334,74 | 0,26 | |||||
33,25 | 1163,75 | 354,22 | 0,78 | |||||
53,25 | 2928,75 | 372,77 | 2,23 | |||||
79,25 | 6894,75 | 402,45 | -1,45 | |||||
109,25 | 13000,75 | 432,13 | -1,13 | |||||
å | =350,00 | =321,75 | 0,00 | =321,75 | 0,00 |
Полученное уравнение =-2,91+0,9276X можно использовать для расчета точечного прогноза, в том числе и на ретроспективу. Подставляя последовательно значения X из второго столбца табл. 2.2 в уравнение =-2,91+0,9276X, получим предпоследний столбец табл. 2.2 для прогнозных значений . Ошибка прогноза вычисляется по формуле ei=Yi - и дана в последнем столбце рабочей таблицы.
Заметим, что ошибка прогноза ei фактически является оценкой значений ui. График ошибки ei представлен на рис. 2.2. Следует отметить факт равенства нулю суммы Sei=0, что согласуется с первым ограничением модели парной регрессии - Eui=0, i=1,…,n. Ñ
Рис. 2.2. График ошибки прогноза
В модели (2.2) функция f может быть и нелинейной. Причем выделяют два класса нелинейных регрессий:
q регрессии, нелинейные относительно включенной объясняющей переменной, но линейные по параметрам, например полиномы разных степеней - Yi =a0 + a1Xi + a2Xi2+ ui, i=1,…,n или гипербола - Yi =a0 + a1/Xi + ui, i=1,…,n;
q регрессии нелинейные по оцениваемым параметрам, например степенная функция - Yi =a0ui, i=1,…,n, или показательная функция - Yi =, i=1,…,n.
В первом случае МНК применяется так же, как и в линейной регрессии, поскольку после замены, например, в квадратичной параболе Yi =a0 + a1Xi + a2Xi2+ ui переменной Xi2 на X1i: Xi2=X1i, получаем линейное уравнение регрессии Yi =a0 + a1Xi + a2X1i+ ui, i=1,…,n.
Во втором случае в зависимости от вида функции возможно применение линеаризующих преобразований, приводящих функцию к виду линейной. Например, для степенной функции Yi =a0ui после логарифмирования получаем линейную функцию в логарифмах и применяем МНК.
Однако для, например, модели Yi =a0+a2+ui линеаризующее преобразование отсутствует, и приходится применять другие способы оценивания (например, нелинейный МНК).
Таблица дисперсионного анализа
Источник вариации | Сумма квадратов отклонений | Число степеней свободы | Среднее квадратов отклонений |
X | |||
Остаток | n-2 | ||
Общая вариация | n-1 | - |
Пример. Для примера табл. 2.1, с учетом предыдущих вычислений, будем иметь таблицу анализа дисперсии - табл. 2.4.
Применяя формулу (2.19), получим . Табличное значение F0,01(1, 10)=10,04, так что имеющиеся данные позволяют отвергнуть гипотезу об отсутствии связи между личными доходами и индивидуальным потреблением. Ñ
Таблица 2.4
Таблица анализа дисперсии (пример в табл. 2.1)
Источник вариации | Сумма квадратов отклонений | Число степеней свободы | Среднее квадратов отклонений |
X | 0,92762*46510 | 40019,1 | |
Остаток | 10*4,6948 | 4,7 | |
Общая вариация | 40066,0 | - |
Классическая линейная модель множественной регрессии
Рассмотрим обобщение линейной регрессионной модели для случая более двух переменных.
Всякий раз, когда изучаемый процесс или явление является результатом совместного действия нескольких факторов, у исследователя возникает потребность в оценке влияния каждого фактора в отдельности. Один из стандартных методов[3], позволяющий успешно решить эту задачу, суть множественная регрессия.
Оценивание коэффициентов КЛММР
Таблица 3.1
Y | 7,5 | 33,0 | 26,0 | 11,5 | 15,8 | 8,0 | 6,0 | 5,8 | 13,8 | 6,20 | 7,9 | 5,4 | 56,0 | 25,5 | 7,1 | |||||
X1 | 2,0 | 14,0 | 33,0 | 2,0 | 11,0 | 3,5 | 2,80 | 17,0 | 3,4 | 24,0 | 9,0 | 4,5 | ||||||||
X2 | 1,1 | 2,55 | 1,7 | 2,4 | 1,55 | 0,6 | 2,3 | 1,4 | 2,1 | 1,3 | 0,35 | 1,65 | 2,9 | 0,75 | 0,6 | 0,9 | 2,5 | 2,2 | 0,95 |
В данном примере мы располагаем пространственной выборкой объема n=20, число объясняющих переменных k=2.
Модель специфицируем в виде линейной функции:
. (3.9)
Следовательно, система нормальных уравнений для модели (3.9) будет иметь вид
(3.10)
Рассчитаем по данным табл. 3.1 необходимые для составления указанной системы суммы:
SY=454,5; | SX1=277,2; | SX2=31,8; |
SY2=18206,89; | S=5860,9; | S=61,45; |
=22,73; | =13,86; | =1,59; |
SX1Y=8912,57; | SX2Y=908,56; | SX1X2=459,24; |
Получим систему нормальных уравнений (3.10) в виде:
Решая последнюю систему линейных алгебраических уравнений, например методом Крамера, получим:
=-17,31; =1,16; =15,10.
Уравнение регрессии имеет вид:
Y=-17,31+1,16×X1+15,10×X2.
Или, с учетом (3.8) и расчетов:
===19,85,
===10,05,
===0,74.
=1,16=0,77, =15,10=0,56
уравнение регрессии в стандартизованном масштабе:
.
То есть с ростом веса груза на одну сигму при неизменном расстоянии стоимость грузовых автомобильных перевозок увеличивается в среднем на 0,77 сигмы. Поскольку 0,77>0,56, то влияние веса груза на стоимость грузовых автомобильных перевозок больше, чем фактора расстояния.
Рассчитаем коэффициенты эластичности
= 1,16×13,86/(-17,31 + 1,16×13,86 + 15,10×1,59) = 0,71,
= 1,05.
С увеличением среднего веса груза на 1% от его среднего уровня средняя стоимость перевозок возрастет на 0,71% от своего среднего уровня, при увеличении среднего расстояния перевозок на 1% средняя стоимость доставки груза увеличится на 1,05%. Различия в силе влияния факторов на результат полученные при сравнении уравнения регрессии в стандартизованном масштабе и коэффициентов эластичности объясняются тем, что коэффициент эластичности рассчитывается исходя из соотношения средних, а стандартизованные коэффициенты регрессии из соотношения средних квадратических отклонений.
Поскольку обычно статистики используют показатель грузооборота, вычисляемый как сумма произведений массы перевезенных грузов на расстояние перевозки, то построим регрессию стоимости 1 км грузовых автомобильных перевозок Y на грузооборот Q (Q=X1X2):
P = 5,88 + 0,48×Q - 0,003×Q2,
причем регрессор Q2 = Q*Q включен исходя из соображений известного экономического закона убывающей предельной полезности, согласно которому в данном случае стоимость перевозки на 1 км должна уменьшаться с ростом грузооборота, т.е. коэффициент при Q2 должен иметь (и в построенном уравнении имеет) отрицательный знак.Ñ
Как уже говорилось в разделе 2.3, регрессионные модели не ограничиваются классом линейных функций. Линеаризация нелинейных функций в уравнении регрессии имеет особенности, рассмотренные в примере.
Пример 2. Исследуется зависимость между выпуском Q (млн. $) и затратами труда L (чел.) и капитала K (млн. $) в металлургической промышленности по 27 американским компаниям. Исходные данные приведены в таблице 3.2.
Таблица 3.2
Q | L | K | Q | L | K | |
657,29 | 162,31 | 279,99 | 1917,55 | 536,73 | 2109,34 | |
935,93 | 214,43 | 542,50 | 9849,17 | 1564,83 | 13989,55 | |
1110,65 | 186,44 | 721,51 | 1088,27 | 214,62 | 884,24 | |
1200,89 | 245,83 | 1167,68 | 8095,63 | 1083,10 | 9119,70 | |
1052,68 | 211,40 | 811,77 | 3175,39 | 521,74 | 5686,99 | |
3406,02 | 690,61 | 4558,02 | 1653,38 | 304,85 | 1701,06 | |
2427,89 | 452,79 | 3069,91 | 5159,31 | 835,69 | 5206,36 | |
4257,46 | 714,20 | 5585,01 | 3378,40 | 284,00 | 3288,72 | |
1625,19 | 320,54 | 1618,75 | 592,85 | 150,77 | 357,32 | |
1272,05 | 253,17 | 1562,08 | 1601,98 | 259,91 | 2031,93 | |
1004,45 | 236,44 | 662,04 | 2065,85 | 497,60 | 2492,98 | |
598,87 | 140,73 | 875,37 | 2293,87 | 275,20 | 1711,74 | |
853,10 | 145,04 | 1696,98 | 745,67 | 137,00 | 768,59 | |
1165,63 | 240,27 | 1078,79 |
Мы располагаем пространственной выборкой объема n=27, число объясняющих переменных k=2.
Модель зависимости между выпуском и затратами труда и капитала, как правило, специфицируется в виде производственной функции, чаще всего Кобба-Дугласа:
. (3.11)
Поскольку модель (3.11) является нелинейной, преобразуем ее к виду линейной по параметрам. Для этого возьмем логарифм от обеих частей в уравнении (3.11):
.
Переобозначим для удобства Y=lnQ, b0=lnA, X1=lnL, X2=lnK, u=lne, тогда имеем линейную модель вида:
. (3.12)
Исходные данные к модели вида (3.11) получаются логарифмированием чисел, представленных в таблице 3.2. Соответственно получим табл. 3.3.
После процедуры лианеризации система нормальных уравнений для модели (3.11) будет иметь такой же вид, как и система (3.10)
Рассчитаем по данным табл. 3.3 необходимые для составления указанной системы суммы:
SY=200,98; | SX1=155,62; | SX2=201,04; |
SY2=1511,07; | S=908,13; | S=1521,31; |
=7,44; | =5,76; | =7,45; |
SX1Y=1170,67; | SX2Y=1514,54; | SX1X2=1173,51; |
Таблица 3.3
Y | X1 | X2 | Y | X1 | X2 | |
6,49 | 5,09 | 5,63 | 7,56 | 6,29 | 7,65 | |
6,84 | 5,37 | 6,30 | 9,20 | 7,36 | 9,55 | |
7,01 | 5,23 | 6,58 | 6,99 | 5,37 | 6,78 | |
7,09 | 5,50 | 7,06 | 9,00 | 6,99 | 9,12 | |
6,96 | 5,35 | 6,70 | 8,06 | 6,26 | 8,65 | |
8,13 | 6,54 | 8,42 | 7,41 | 5,72 | 7,44 | |
7,79 | 6,12 | 8,03 | 8,55 | 6,73 | 8,56 | |
8,36 | 6,57 | 8,63 | 8,13 | 5,65 | 8,10 | |
7,39 | 5,77 | 7,39 | 6,38 | 5,02 | 5,88 | |
7,15 | 5,53 | 7,35 | 7,38 | 5,56 | 7,62 | |
6,91 | 5,47 | 6,50 | 7,63 | 6,21 | 7,82 | |
6,40 | 4,95 | 6,77 | 7,74 | 5,62 | 7,45 | |
6,75 | 4,98 | 7,44 | 6,61 | 4,92 | 6,64 | |
7,06 | 5,48 | 6,98 |
Получим систему нормальных уравнений после подстановки соответствующих значений в (3.10) в виде:
Решая последнюю систему методом Крамера, получим:
=1,11, =0,56, =0,41.
Уравнение регрессии имеет вид:
Y=1,11+0,56×X1+0,41×X2.
Или, с учетом (3.8) и расчетов: =0,75, =0,65, =0,96, =0,56=0,48, =0,41=0,52 уравнение регрессии в стандартизованном масштабе:
.
Нетрудно восстановить (учитывая, что A==3,03) исходную модель (3.9)
.
Эластичность выпуска продукции Q по труду L равна 0,56, а эластичность выпуска продукции Q по капиталу K равна 0,41. Следовательно увеличение затрат труда на 1% приведет к росту выпуска продукции на 0,56%, а увеличение затрат капитала на 1% приведет к росту выпуска продукции на 0,41%.
Очевидно, что обе величины и должны находиться между нулем и единицей. Они должны быть положительными, так как увеличение затрат факторов должно вызывать рост выпуска. В то же время, вероятно, они будут меньше единицы, т.к. мы предполагаем, что уменьшение эффекта от масштаба производства приводит к более медленному росту выпуска продукции, чем затрат производственных факторов, если другие факторы остаются постоянными.
Продолжая интерпретацию результатов регрессии , отметим, что (+)<1, т.е. имеет место убывающий эффект от масштаба производства (выпуск увеличивается в меньшей пропорции, чем L и K). Ñ
Множественный коэффициент корреляции
Таблица 3.4
Таблица дисперсионного анализа
Источник вариации | Сумма квадратов отклонений | Число степеней свободы | Дисперсия на одну степень свободы |
k | |||
Остаток | n-k-1 | ||
Общая вариация | n-1 |
Если F>Fe, то гипотеза об отсутствии связи между переменными и y отклоняется, в противном случае гипотеза Н0 принимается и уравнение регрессии не значимо.
Пример (продолжение примера 1). Заполним таблицу дисперсионного анализа:
Таблица дисперсионного анализа
Источник вариации | Сумма квадратов отклонений | Число степеней свободы | Дисперсия |
5828,84 | 2914,42 | ||
Остаток | 2049,54 | 120,56 | |
Общая вариация | 7878,38 |
Получаем , .
В нашем примере F>Fe, следовательно, нулевая гипотеза отклоняется, и уравнение множественной регрессии значимо. Ñ
Помимо проверки значимости уравнения в целом, можно проверить статистическую значимость каждого из коэффициентов регрессии в отдельности.
Фактически это означает проверку одной из гипотез:
1); …; k) .
Статистическая значимость каждого из коэффициентов регрессии определяется при помощи t-критерия Стьюдента. Решение о том, что верна нулевая гипотеза, принимается в случае, когда |t|<te, иначе принимается альтернативная гипотеза.
Значение t-статистики Стьюдента в случае множественной регрессии определяется по формуле:
, (3.24)
где - стандартная ошибка коэффициента регрессии , которая определяется по формуле
, (3.25)
здесь - стандартное отклонение y;
- стандартное отклонение xi;
- коэффициент детерминации для зависимости фактора xi от других факторов уравнения множественной регрессии.
Пример (продолжение примера 1). Проверим значимость коэффициентов регрессии. В случае, когда в уравнение регрессии включены две независимые переменные, формула (3.24) упрощается
, .
Таким образом:
=4,69,=4,50,
.
Так как в обоих случаях , то коэффициенты регрессии значимы, следовательно, и вес груза, и расстояние грузовой перевозки оказывают существенное, статистически значимое влияние на стоимость перевозки. Ñ
Спецификация переменных в уравнениях регрессии
Линейная модель множественной регрессии
Линейная модель множественной регрессии
Рис. 4.2. Автокорреляция остатков
Более достоверным способом проверки существования автокорреляции является применение статистических критериев. Хорошо известны два – критерий знаков (относится к непараметрическим критериям) и критерий Дарбина-Уотсона.
Для проведения проверки по критерию знаков необходимо расположить остатки ei во временной последовательности, выписать их знаки, подсчитать число образующихся при этом серий nu из одинаковых знаков, а также n1 – число остатков со знаком плюс и n2 – число остатков со знаком минус. Далее определяется вероятность Pr(nu) появления nu групп при нулевой гипотезе – последовательность остатков полностью случайна (автокорреляция отсутствует). Если Pr(nu) < 1–a, где a – уровень доверия, то нулевая гипотеза отвергается.
Для ускорения расчетов для выборок с n1, n2 не больше 20 составлены таблицы с критическими значениями nu при уровне доверия a=0,05.
Для больших выборок истинное распределение ошибок достаточно точно аппроксимируется нормальным со средним m=2n1n2/(n1+n2)+1 и дисперсией s2=2n1n2(2n1n2 – n1 – n2)/(n1 + n2)2/(n1 + n2 – 1), а величина z=(u – m + 0,5)/s подчиняется нормированному нормальному распределению, следовательно, критические значения nu могут быть вычислены по формулам (m + zas) и (m – zas), где za определяется из условия F0(za)=(1–a)/2 (значения даны в справочниках).
Пример. Получены остатки 0,6; 1,9; –1,8; –2,7; –2,9; 1,4; 3,3; 0,3; 0,8; 2,3; –1,4; –1,1, которые обнаруживают следующую последовательность знаков + + – – – + + + + + – –. Имеем nu=4, n1=7, n2=5. По таблице находим критические значения для nu: 3 и 11. Так как 3 < nu < 11, то нулевая гипотеза принимается, то есть остатки независимы и автокорреляция отсутствует.Ñ
Критерий знаков достаточно прост и не использует информацию о величине ei, и поэтому недостаточно эффективен.
Для проверки гипотезы о существовании линейной автокорреляции первого порядка, которая чаще всего имеет место на практике, предпочтителен критерий Дарбина-Уотсона, основанный на статистике:
(4.9)
Значения первых разностей ошибки в (4.9) будут обнаруживать тенденцию к уменьшению по абсолютной величине по сравнению с абсолютными значениями ei при положительной автокорреляции и к увеличению при отрицательной автокорреляции.
Для статистики d имеются верхний dU и нижний dL пределы уровня значимости. Различные статистические решения для нулевой гипотезы H0: автокорреляция равна нулю, даны в табл. 4.3. При этом появляются области неопределенности, так как величина ei зависит не только от значений u, но и от значений последовательных X.
Следует отметить, что критерий Дарбина-Уотсона предназначен для моделей с детерминированными (нестохастическими) регрессорами X и не применим, например, в случаях, когда среди объясняющих переменных есть лаговые значения переменной Y.
Таблица 4.3
Области статистических решений для критерия Дарбина-Уотсона
d<dL | dL<d<dU | dU<d<2; 2<d<(4–dU) | (4–dU)<d<(4–dL) | d>(4–dL) |
Отвергаем H0 в пользу гипотезы о положительной автокорреляции | H0 не принимается и не отвергается | Принимается H0 | H0 не принимается и не отвергается | Отвергаем H0 в пользу гипотезы об отрицательной автокорреляции |
Пример. Для примера 1 из п. 3.2 n=20, k=2 имеем табл. 4.4.
Далее по формуле (4.9) d=4397,66/2050,37=2,14.
Значения dL и dU при уровне значимости 5% получим из справочника при n=20 и k=2: dL=1,10, dU=1,54.
Так как d>2, то вычисляем 4–dU=2,46 и 4–dL=2,90 и 2<d<4–dU.
Согласно табл. 4.3 гипотеза о равенстве нулю автокорреляции принимается. Ñ
Какой бы тест на автокорреляцию не использовался, необходимо помнить, что рекомендуется в случаях неопределенности (см. табл. 4.3) принимать гипотезу о наличии автокорреляции, поскольку это гарантирует от отрицательных последствий автокорреляции. В случаях же некорректного принятия гипотезы о равенстве нулю автокорреляции получаем модель, которая не может иметь удовлетворительного применения, хотя формально проходит все проверки.
Таблица 4.4
Вычисление значения статистики d
Ошибка ei | ei2 | ei-1 | (ei-ei-1)2 | Ошибка ei | ei2 | ei-1 | (ei-ei-1)2 |
-2,49 | 6,20 | -0,68 | 0,46 | -8,72 | 64,64 | ||
-1,86 | 3,46 | -2,49 | 0,40 | 5,27 | 27,72 | -0,68 | 35,40 |
31,93 | 1019,21 | -1,86 | 1141,76 | -5,29 | 27,93 | 5,27 | 111,51 |
-3,18 | 10,11 | 31,93 | 1232,71 | -16,74 | 280,23 | -5,29 | 131,10 |
-2,17 | 4,71 | -3,18 | 1,02 | 8,94 | 79,87 | -16,74 | 659,46 |
-18,38 | 337,64 | -2,17 | 262,76 | -3,57 | 12,74 | 8,94 | 156,50 |
-3,45 | 11,90 | -18,38 | 222,90 | 5,18 | 26,79 | -3,57 | 76,56 |
5,58 | 31,14 | -3,45 | 81,54 | 7,72 | 59,60 | 5,18 | 6,45 |
-3,11 | 9,67 | 5,58 | 75,52 | -0,85 | 0,72 | 7,72 | 73,44 |
-8,72 | 76,04 | -3,11 | 31,47 | 4,85 | 23,47 | -0,85 | 32,49 |
Сумма | 2050,37 | 4397,66 |
Рассмотрим методы оценивания уравнения регрессии при наличии автокорреляции остатков.
Пусть имеем обобщенную линейную модель множественной регрессии в виде (4.3)-(4.7) с гомоскедастичными остатками .
Предположим, что остатки ui удовлетворяют следующему уравнению:
ui=rui-1+ei, i=2,...,n, (4.10)
представляющему собой авторегрессионную модель первого порядка, для которой выполнено |r|£1, а ei удовлетворяют условиям:
E(ei)=0; (4.11)
Тогда несложно показать, что будет выполняться:
. (4.12)
Условие (4.12) является аналогом (4.5) и фактически означает гомоскедастичность дисперсии случайного члена (первая строчка) и автокорреляцию первого порядка (вторая строчка). Ясно, что если бы было известно значение r в (4.10) и затем в (4.12), то можно было бы применить ОМНК (элементы матрицы W в этом случае вычисляются согласно (4.12)) и получить эффективные оценки коэффициентов регрессии. Однако на практике значение r в большинстве случаев не известно, поэтому используются следующие методы оценивания регрессионной модели.
Метод 1. Отказавшись от определения величины r, являющейся узким местом модели, статистически, можно положить r=0,5; 1 или -1. Однако даже грубая статистическая оценка будет, видимо, более эффективной, поэтому другой способ определения r с помощью статистики Дарбина-Уотсона r»1–0,5d. Применяя затем непосредственно ОМНК, получим оценки коэффициентов.
Метод 2. Если значение r в (4.12) задано, то альтернативная схема отыскания оценок коэффициентов модели множественной регрессии суть (в целях упрощения, не нарушая общности, иллюстрация метода дана для случая парной регрессии):
а) Запишем уравнение модели для случая i и i–1:
.
Вычтем из обеих частей первого уравнения умноженное на r второе уравнение:
или переобозначив:
с учетом (4.10) , получим модель
, (4.13)
для случайного члена которой выполняется условие (4.11), т.е. автокорреляция отсутствует. При указанном преобразовании первое наблюдение умножается на , т.е. , .
б) Применяем обыкновенный МНК к модели (4.13).
В общем случае мы не располагаем информацией о порядке автокорреляции и значениях параметров в авторегрессионном уравнении, а значит, и методы 1 и 2 не дадут искомого результата.
Тем не менее, оценки коэффициентов можно найти приближенно с помощью следующих методов (опять в целях упрощения, не нарушая общности, иллюстрация методов дана для случая парной регрессии).
Метод 3. Итеративная процедура Кохрейна-Оркатта.
а) Оценивается регрессия с исходными не преобразованными данными с помощью обыкновенного МНК.
б) Вычисляются остатки ei.
в) Оценивается регрессия ei=rei-1+ei, и коэффициент при ei-1 дает оценку r.
г) С учетом полученной оценки r уравнение преобразовывается к виду (4.13), оценивание которого позволяет получить пересмотренные оценки коэффициентов b0 и b1.
д) Вычисляются остатки регрессии (4.13) и процесс выполняется снова, начиная с этапа в).
Итерации заканчиваются, когда абсолютные разности последовательных значений оценок коэффициентов b0, b1 и r будут меньше заданного числа (точности).
Подобная процедура оценивания порождает проблемы, касающиеся сходимости итерационного процесса и характера найденного минимума: локальный или глобальный.
Метод 4. Метод Хилдрета-Лу основан на тех же принципах, что и рассмотренный метод 3, но использует другой алгоритм вычислений. Здесь регрессия (4.13) оценивается МНК для каждого значения r из диапазона [-1, 1] с некоторым шагом внутри него. Значение, которое дает минимальную стандартную ошибку для преобразованного уравнения (4.13), принимается в качестве оценки r, а коэффициенты регрессии определяются при оценивании уравнения (4.13) с использованием этого значения.
Метод 5. Дарбиным была предложена простая схема, дающая эффективные оценки коэффициентов:
а). Подставляя (4.10) в модель Yi=b0+b1Xi+ui, получим с учетом ui-1 = Yi-1 - b0 - b1Xi-1:
Yi=b0(1-r)+rYi-1+b1(Xi - rXi-1) + ei,
где ошибка ei удовлетворяет (4.11). Применяя обыкновенный МНК к последней модели, получаем оценку r как коэффициента при Yi-1.
б). Вычисляем значения преобразованных переменных и применяем к ним обыкновенный МНК. Получаем искомые оценки коэффициентов регрессии.
Достоинством метода является простота его распространения на случай автокорреляции более высокого порядка.
Как показывают эксперименты, проведенные для малых выборок, лучшим является двухшаговый метод 2, использующий оценку r, полученную по методу, предложенному Дарбиным (метод 5 шаг а)).
Таблица 4.5
Таблица 4.6
Источник вариации | Сумма квадратов | Степени свободы | Средний квадрат |
X | 24,447 | 10,414 | |
Z, XZ | 6,797 | 3,399 | |
Остаток | 6,881 | 0,983 | |
Всего | 38,125 |
Часто эконометрист сталкивается с ситуацией, когда к уже имеющейся выборке он хочет присоединить небольшую дополнительную порцию данных, но не знает, можно ли считать выборки регрессионно однородными.
Если необходимо выяснить, можно ли использовать одну и ту же модель для двух разных выборок данных или следует оценивать отдельные регрессии для каждой выборки, то можно воспользоваться тестом Чоу.
Рассмотрим модели:
(4.14)
(4.15)
Мы хотим проверить гипотезу
H0: ,
которая содержательно означает, что для двух имеющихся выборок из n1 и n2 наблюдений можно использовать одну и ту же регрессионную модель, т.е. выборки можно объединить.
Процедура Чоу для статистической проверки гипотезы H0 суть:
1. Строим МНК оценки регрессии (4.14) и вычисляем сумму квадратов остатков, которую обозначим . Строим МНК оценки регрессии (4.15) и вычисляем сумму квадратов остатков, которую обозначим .
2. Строим МНК оценки регрессии по объединенной (общей) выборке, содержащей в себе все наблюдения (числом n1+n2) обеих выборок и вычисляем сумму квадратов остатков, которую обозначим er.
3. Критическая статистика F вычисляется по формуле:
и имеет распределение Фишера с (k+1) и (n1+n2-2k-2) степенями свободы. Если F > Fa, то нулевая гипотеза отвергается, и в этом случае мы не можем объединить две выборки в одну.
Временные ряды
– Конец работы –
Используемые теги: курс, лекций, дисциплине, Эконометрика, последнее, время, специалисты0.094
Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Курс лекций по дисциплине Эконометрика. В последнее время специалисты
Если этот материал оказался полезным для Вас, Вы можете сохранить его на свою страничку в социальных сетях:
Твитнуть |
Новости и инфо для студентов