Спецификация уравнения регрессии и ошибки спецификации
Спецификация уравнения регрессии и ошибки спецификации - раздел Экономика, Курс лекций по дисциплине Эконометрика. В последнее время специалисты
При Построении Эконометрической Модели Исследователь Специфиц...
При построении эконометрической модели исследователь специфицирует составляющие ее соотношения, выбирает переменные, входящие в эти соотношения, а также определяет вид математической функции, представляющей каждое соотношение. Остановимся на вопросе выбора переменных, которые должны быть включены в модель. До сих пор мы неявно считали, что имеем правильную спецификацию модели.
На практике никогда не получается правильная спецификация модели, возникают так называемые ошибки спецификации. Экономическая теория, положения которой используются при выборе регрессоров, не может быть совершенной. Поэтому исследователь может включить в эконометрическую модель переменные, которых там не должно быть, и может не включить другие переменные, которые должны там присутствовать.
Т.е. изучим две ситуации.
Случай 1. Исключены существенные переменные.
Процесс, порождающий данные:
, i=1,…,n. (4.1а)
Модель:
(4.1б)
Случай 2. Включены несущественные переменные.
Процесс, порождающий данные:
(4.2а)
Модель:
, i=1,…,n (4.2б)
Часто регрессию (4.1а) называют длинной, а регрессию (4.1б) – короткой.
В первом случае, если опущены переменные, которые должны быть включены в регрессию, оценки коэффициентов , j=1,…,k являются, вообще говоря, смещенными (но обладают меньшей дисперсией) за исключением двух случаев, когда =0, j=1,…,l или регрессоры X1,…, Xk и Z1,…, Zl ортогональны.
Смещенной является и оценка дисперсии случайной ошибки , а, следовательно, стандартные ошибки и многие статистические тесты, в которых используется значение , становятся некорректными.
Во втором случае, если включены переменные, которые не должны присутствовать в модели, оценки коэффициентов , j=1,…,k будут несмещенными, но неэффективными. Поскольку несмещенность оценок и величины дисперсии сохраняется, возникает иллюзия, что надо включать в модель как можно больше регрессоров. Но в этом случае падает точность оценок, и может возникнуть проблема мультиколлинеарности объясняющих переменных.
На практике, однако, нам неизвестен процесс, порождающий данные, т.е. мы не знаем истинную модель. Поэтому, как правило, возникает проблема – какую модель выбрать: короткую или длинную, т.е. включать дополнительные регрессоры в модель или не включать: в первом случае мы получим смещенные оценки коэффициентов регрессии, а во втором случае – неэффективные оценки. Решение этой проблемы может быть найдено на основе критерия минимума среднеквадратичного отклонения значений коэффициентов, см. [5, с. 112-114].
Часто случается также, что исследователь не может использовать данные по переменным, которые включены в модель. Некоторые переменные, например, невозможно измерить, другие поддаются измерению, но это достигается большими затратами времени и ресурсов. В таких случаях вместо отсутствующих переменных полезно использовать некоторые их заменители (proxy).
Например, если вы не имеете данных о качестве образования, вы можете использовать показатель качества образования как отношение числа преподавателей к числу студентов или денежные расходы на одного студента.
Причин использования "прокси"-переменных две: во-первых, если пропущена важная для модели переменная, то оценки будут смещены (случай 1 выше), а, во-вторых, результаты оценки регрессии с включением замещающих переменных могут дать косвенную информацию о тех переменных, которые замещены данными переменными.
Области применения эконометрических моделей
Области применения эконометрических моделей напрямую связаны с целями эконометрического моделирования, основными из которых являются:
1) прогноз экономических и социально-экономичес
Постановка задачи регрессии
Поставим задачу регрессии Y на X.
Пусть мы располагаем n парами выборочных наблюдений над двумя переменными X и Y:
Парная регрессия и метод наименьших квадратов
Будем предполагать в рамках модели (2.2) линейную зависимость между двумя переменными Y и X. Т.е. имеем модель парной регрессии в виде:
Yi =a+
Оценка статистической значимости регрессии
Перейдем к вопросу о том, как отличить "хорошие" оценки МНК от "плохих". Конечно, предполагается, что существуют критерии качества рассчитанной линии регрессии.
Перечис
Интерпретация уравнения регрессии
Проанализируем, какую информацию дает нам оцененное уравнение регрессии (2.6), т.е. поставим вопрос об интерпретации (содержательном объяснении) коэффициентов уравнения.
Во-первых,
Предположения модели
Пусть мы располагаем выборочными наблюдениями над k переменными Yi и , j=1,..., k,
Методом наименьших квадратов
Применяя к (3.1) с учетом (3.2)-(3.5) МНК, получаем из необходимых условий минимизации функционала:
,
т.
Парная и частная корреляция в КЛММР
В случаях, когда имеется одна независимая и одна зависимая переменные, естественной мерой зависимости (в рамках линейного подхода) является выборочный (парный) коэффициент корреляции между ними.
И множественный коэффициент детерминации
Множественный коэффициент корреляции используется в качестве меры степени тесноты статистической связи между результирующим показателем (зависимой переменной) y и набором объясняющих
Оценка качества модели множественной регрессии
Проверка качества модели множественной регрессии может быть осуществлена с помощью дисперсионного анализа.
Как уже было отмечено (см. 2.5), сумма квадратов отклонений от среднего в выборке
С гетероскедастичными остатками
Довольно часто при построении регрессии анализируемые объекты неоднородны, например, при исследовании структуры потребления домохозяйств естественно ожидать, что колебания в структуре будут выше дл
С автокорреляцией остатков
Вернемся еще раз к предположению (3.3). Из него, в частности, следует, что ковариации случайной ошибки для разных наблюдений равны нулю. Если к тому же случайные ошибки распределены нормально, то э
Фиктивные переменные. Тест Чоу
Факторы (объясняющие переменные), применяемые в задаче регрессии до сих пор, принимали значения из некоторого непрерывного интервала. Иногда может понадобиться ввести в модель переменные, значения
Специфика временных рядов
Часто исследователь имеет дело с данными в виде временных рядов.
Совокупность наблюдений анализируемой величины
Проверка гипотезы о существовании тренда
Для выявления факта наличия или отсутствия неслучайной составляющей f(t), то есть для проверки гипотезы о существовании тренда - Н0: Еy(t
Метод последовательных разностей
Часто при аналитическом выравнивании ряда используется модель тренда в виде полинома.
Для определения порядка аппроксимирующего полинома в этом случае выделения тренда широко используется
Аддитивная и мультипликативная модели временного ряда
Простейшим подходом к моделированию временных рядов, содержащих сезонные колебания, является построение аддитивной или мультипликативной моделей временного ряда.
Выбор одной из этих моделе
Тестирование стационарности временного ряда
Как было отмечено выше, стационарные временные ряды имеют следующие отличительные черты: значения ряда колеблются вокруг постоянного среднего значения с постоянной дисперсией, которая не зависит от
Библиографический список
1. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. Учебник для вузов. М.: ЮНИТИ, 1998. 1022 с.
2. Джонстон Дж. Эконометрические методы.- М.: Статис
Хотите получать на электронную почту самые свежие новости?
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Новости и инфо для студентов