рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Модели ANСOVA при наличии у качественных переменных более двух альтернатив

Модели ANСOVA при наличии у качественных переменных более двух альтернатив - раздел Финансы, ЛЕКЦИЯ 1 1. Под редакцией И. И. Елисеевой Эконометрика, М,: Финансы и статистика, -2001 г   Пусть Рассматривается Модель С Двумя Объясняющими Переменными...

 

Пусть рассматривается модель с двумя объясняющими переменными, одна из которых количественная, а другая – качественная. Причем качественная переменная имеет три альтернативы.

Например, расходы на содержание ребенка –(у) могут быть связаны с доходами семьи (х)и возрастом ребенка (D): дошкольный, младший школьный и старший школьный.

Так как качественная переменная связана с тремя альтернативами, то по общему правилу моделирования необходимо использовать две фиктивные переменные. Таким образом, модель может быть представлена в виде:

 

 

 

 

Образуются следующие зависимости:

Средний расход на дошкольника:

 

 

Средний расход на младшего школьника:

 

 

Средний расход на старшего школьника:

 

 

Здесь с1 и с2 – дифференциальные свободные члены. Базовым значением качественной переменной является значение «дошкольник».Таким образом, получаются три регрессионные прямые, параллельные друг другу и отличающиеся свободным членом.


ЛЕКЦИЯ 11

При оценке параметров уравнения регрессии применяется МНК. При этом делаются определенны е предпосылки относительно случайной составляющей ε.

При изменении спецификации модели, добавлении в нее новых наблюдений остатки ε могут меняться. Поэтому в задачу регрессионного анализа входит не только построение самой модели, но и исследование случайных отклонений ε, ть. Е. остаточных величин.

Для того, чтобы результаты регрессионного анализа с использованием МНК имели практическое значение, оценки параметров регрессии должны отвечать определенным критериям.

Они должны быть несмещенными, состоятельными и эффективными.

Несмещенность оценки означает, что математическое ожидание остатков равно нулю. Следовательно, при большом числе оцениваний остатки не будут накапливаться и найденный параметр регрессии bi можно рассматривать как среднее значение из возможного большого количества оценок. Если оценки свойством обладают несмещенности, то их можно сравнивать по разным исследованиям.

Оценки считаются эффективными, если они характеризуются наименьшей дисперсией. Поэтому несмещенность оценки должна дополняться минимальной дисперсией. В практических исследованиях это означает возможность перехода от точечного оценивания к интервальному.

Состоятельность оценок характеризует увеличение их точности с увеличением объема наблюдений.

Условия, необходимые для получения несмещенных, состоятельных и эффективных оценок, представляют собой предпосылки МНК, которых пять:

1. случайный характер остатков;

2. нулевая средняя величина остатков, не зависящая от хi;

3. гомоскедастичность – дисперсия каждого отклонения εi одинакова для всех значений х;

4. отсутствие автокорреляции остатков. Значения εi распределены независимо друг от друга;

5. остатки подчиняются нормальному распределению

 

Если все 5 предпосылок выполняются, то оценки, полученные по МНК совпадают в любых исследованиях между собой.

Если хотя бы одна из предпосылок отсутствует, следует корректировать модель.

 

Проверка первой предпосылки МНК – случайный характер остатков εi

 

С этой целью строится график остатков εi от теоретических значений результативного признака.

 

 

 

 

 


Если на графике получена горизонтальная полоса, то остатки εi представляют собой случайные величины и МНК оправдан, теоретические значения хорошо аппроксимируют фактические значения у.

Возможны следующие случаи: если εi зависит от , то

а) остатки εi не случайны; б) остатки εi не имеют постоянной дисперсии; в) остатки εi носят систематический характер.

В этих случаях необходимо либо вводить новую информацию и заново строить уравнение регрессии, либо применять другую функцию.

Вторая предпосылка МНК относительно нулевой средней величины остатков означает, что Это выполнимо для линейных моделей и моделей, нелинейных относительно включаемых переменных, для моделей, нелинейных по оцениваемым параметрам и приводимых к линейному виду путем логарифмирования, например для степенной функции для проверки второй предпосылки строится график зависимости остатков εi от факторов, включенных в регрессию xi.

 
 

 


Если остатки на графике расположены в виде горизонтальной полосы, то они независимы от значений xi. Если же график показывает наличие зависимости εi от xi, модель неадекватна. Причины этого могут быть разные. Возможно, что нарушена третья предпосылка МНК и дисперсия остатков непостоянна для каждого значения фактора xi. Может быть неправильна спецификация модели.

Третья предпосылка требует, чтобы дисперсия остатков была гомоскедастичной. Это означает, что дисперсия остатков εi одинакова для каждого значения фактора xi. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность. Наличие гетероскедастичностиможно наглядно видеть из поля корреляции.


а) б) в)

 

а) дисперсия остатков растет по мере увеличения х; б) дисперсия остатков достигает максимальной величины при средних значениях переменной х и уменьшается при максимальных и минимальных значениях х;

в) максимальная дисперсия остатков при малых значениях х и дисперсия остатков однородна по мере увеличения значений х.

Гомоскедастичность остатков означает, что дисперсия остатков одинакова для каждого значения х.

 
 

Используя трехмерное изображение, получают графики, иллюстрирующие гомо- и гетероскедастичность.

 

 

Рис.1. Гомоскедастичность остатков

 

Для каждого значения х распределения остатков εi одинаковы.

       
 
 
   
x

 

 


Рис. 2. Гетероскедастичность остатков

 

Диапазон варьирования остатков меняется с переходом от одного значения х i к другому. То есть имеет место неодинаковая дисперсия ε i при разных значениях х i .

Для множественной регрессии наиболее приемлемым визуальным способом изучения гомо- или гетероскедастичности является график зависимости остатков ε i от теоретических значений результативного признака у х.

При нарушении гомоскедастичности мы имеем неравенства:

 

, j = i

 

и можно записать

.

 

При этом величина k i может меняться при переходе от одного фактора х j к другому. Это означает, что сумма квадратов отклонений для зависимости при наличии гетероскедастичности должна иметь вид:

 

SS гетеро =.

 

Четвертая предпосылка МНК – отсутствие автокорреляции остатков, т. е. значения εί распределены независимо друг от друга.

Автокорреляция остатков означает наличие корреляции между εί и εj ; где εί – остатки текущих наблюдений; εj - остатки предыдущих наблюдений, например, j=i-1.

Коэффициент корреляции может быть определен как

 

т. е. по обычной формуле линейного парного коэффициента корреляции.

При несоблюдении основных предпосылок МНК приходится корректировать модель, добавлять или исключать факторы, прообразовывать исходные данные.

При этом рекомендуется традиционный метод наименьших квадратов (МНК) заменять обобщенным методом.

Обобщенный метод наименьших квадратов применяется к преобразованным данным и позволяет получать оценки, которые обладают не только свойством несмещенности, но и имеют меньшие дисперсии. Специфика обобщенного МНК применительно к корректировке данных при автокорреляции остатков предполагает, что среднее значение остаточных величин равно нулю. А вот дисперсия их не остается неизменной для разных значений фактора, а пропорциональна величине Кj, т.е.

 

σ2 ε j = σ2 *K j,

 

где – σ 2 ε j – дисперсия ошибки при конкретном j- ом значении фактора;

σ 2 – постоянная дисперсия при соблюдении предпосылки о

гомоскедастичности остатков;

Кj – коэффициент пропорциональности, меняющийся с изменением величины фактора, что обуславливает неоднородность дисперсии.

При этом предполагается, что σ2 неизвестна, а в отношении величины К выдвигаются определенные гипотезы, характеризующие структуру гетероскедастичности.

В общем виде для уравнения

 

Y j = a + b * x j + ε j при σ2 e j = σ 2 *K j,

 

Модель примет вид: y j = α + β j * x j + * ε j.

 

В ней остаточные величины гетероскедастичны. Предполагая в них отсутствие автокорреляции, можно перейти к уравнению с гомоскедастичными остатками, поделив все переменные, зафиксированные в ходе j – го наблюдения на . Тогда дисперсия остатков будет величиной постоянной, т. е. σ 2 εj = σ 2.

Иными словами от регерессии у по х мы перейдем к регрессии на новых переменных: у / и х / .

Уравнение регрессии примет вид:

 

По отношению к обычной регрессии уравнение с новыми преобразованными переменными представляет собой взвешенную регрессию, в которой переменные у и х взяты с весами .

Оценка параметров нового уравнения с преобразованными переменными приводит к взвешенному методу наименьших квадратов, для которого необходимо минимизировать сумму квадратов отклонений вида

 

S = *(y j – a – b * x j) 2.

Если преобразованные переменные х и у взять в отклонениях от средних уровней, то коэффициент регрессии b можно определить как

.

 

При обычном применении МНК к уравнению линейной регрессии для переменных в отклонениях от средних уровней коэффициент регрессии определяется по формуле

.

Как видим, при использовании обобщенного МНК с целью корректировки гетероскедастичности коэффициент регрессии b представляет собой взвешенную величину по отношению к обычному МНК с весами 1/К.

Аналогичный подход возможен не только для уравнения парной, но для множественной регрессии.

Предположим, что рассматривается модель вида

 

У=a+b1*x1 +b2*x2+ε,

 

для которой дисперсия остаточных величин оказалась пропорциональна К2j.

K j- представляет собой коэффициент пропорциональности , принимающий различные значения для соответствующих j значений факторов х1 и х2. Ввиду того, что

 

σ 2 εj = σ2 * K 2 j,

 

 

рассматриваемая модель примет вид

 

y j = a +b1*x1 + b2*x2 + k jj,

 

где ошибки гетероскедастичны.

Для того, чтобы получить уравнение, где остатки гомоскедастичны, перейдем к новым преобразованным переменным, разделив все члены исходного уравнения на коэффициент пропорциональности К.

Уравнение с преобразованными переменными составит

 

.

 

Это уравнение не содержит свободного члена. Вместе с тем, найдя переменные в новом преобразованном виде и применяя обычный МНК к ним, получим иную спецификацию модели:

=A + b1 *

 

Параметры такой модели зависят от концепции, принятой для коэффициента пропорциональности Кj . В эконометрических исследованиях довольно часто выдвигается гипотеза, что остатки e j пропорциональны значениям фактора, Так, если в уравнении

 

У = a + b1*x1 + b2 * x2 +…+b p *x p + E

 

предположить, что E = ε*x1, т. е. К = х1 и σ 2 ε j = σ 2*x1 2 , то обобщенный МНК предполагает оценку параметров следующего трансформированного уравнения:

 

 

Если предположить, что ошибки пропорциональны x p, то модель примет вид:

 

 

Применение в этом случае обобщенного МНК приводит к тому, что наблюдения с меньшими значениями преобразованных переменных х / К имеют при определении параметров регрессии относительно больший вес, чем с первоначальными переменными. Вместе с тем следует иметь в виду, что новые преобразованные переменные получают новое экономическое содержание и их регрессия имеет иной смысл, чем регрессия по исходным данным.

 

ЛЕКЦИЯ 12

 

– Конец работы –

Эта тема принадлежит разделу:

ЛЕКЦИЯ 1 1. Под редакцией И. И. Елисеевой Эконометрика, М,: Финансы и статистика, -2001 г

СПИСОК ЛИТЕРАТУРЫ... Под редакцией И И Елисеевой Эконометрика М Финансы и статистика г Под редакцией И И Елисеевой Практикум по эконометрике М Финансы и статистика г...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Модели ANСOVA при наличии у качественных переменных более двух альтернатив

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Определение коэффициентов интеркорреляции
  Коэффициентами интеркорреляции являются коэффициенты корреляции между объясняющими переменными (факторами) х1, х2, ….

Устранение межфакторной корреляции
  Существует ряд подходов преодоления сильной межфакторной корреляции: 1. Исключение из модели одного или нескольких факторов. 2. Преобразование факторов, при которо

Расчет коэффициентов эластичности
  Для множественного уравнения регрессии рассчитываются средние и частные коэффициенты эластичности. Средние коэффициенты эластичности для множественной регрессии расс

МНОЖЕСТВЕННАЯ КОРРЕЛЯЦИЯ И ДЕТЕРМИНАЦИЯ
  Для множественной регрессии рассчитываются показатели множественной и частной корреляции. Показатель множественной корреляции характеризует тесноту связи рассматриваемого н

Частная корреляция
  Частные коэффициенты (или индексы) корреляции характеризуют тесноту связи между результатом у и соответствующим фактором x

Оценка надежности результатов множественной регрессии, корреляции и фактора, дополнительно включенного в модель
  Статистическая значимость множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью F-критерия Фишера:  

СИСТЕМЫ ЭКОНОМЕТРИЧЕСКИХ УРАВНЕНИЙ
  Общее понятие о системах уравнений, используемых в эконометрике   Потребность в использовании систем уравнений связано с тем, что при использовании отдельных

Методы оценивания параметров структурной модели
Коэффициенты структурной модели могут быть оценены разными способами в зависимости от вида системы одновременных уравнений. Наибольшее распространение получили следующ

ПРИМЕНЕНИЕ ЭКОНОМЕТРИЧЕСКИХ СИСТЕМ
  Наиболее широко они используются для построения макроэкономических моделей функционирования экономики той или иной страны.   МОДЕЛИ КЕЙНСА &nb

Временные ряды в эконометрических исследованиях
основные элементы временного ряда   Можно построить экономическую модель, используя два типа исходных данных: · Данные, характеризующие совокупность различ

Автокорреляция уровней временного ряда. Выявление его структуры
  При наличии во временном ряде тенденции и циклических колебаний значения каждого последующего уровня зависят от предыдущих. Корреляционную зависимость между последовательны

Моделирование тенденции временного ряда
Для выявления основной тенденции (тренда) в уровнях ряда используется аналитический метод выравнивания. Этот способ называют аналитическим выравниванием временного ряда. Данный мет

Моделирование сезонных и циклических колебаний
Существует несколько подходов при моделировании сезонных или циклических колебаний: · расчет значений сезонной компоненты и построение аддитивной или мультипликативной модели временного ря

Построение аддитивной модели временного ряда
  Для расчетов используем данные об объеме выпуска некоторого товара по кварталам за 3 года, представленные в табл. 1. Анализ величины коэффициентов автокорреляции показал, ч

Построение мультипликативной модели временного ряда
  Определим компоненты мультипликативной модели временного ряда, используя данные о поквартальном объеме выработки некоторой продукции за 3 года, использованные для расчета компонент

Прогнозирование по моделям временного ряда
  По аддитивной модели   Предположим, по данным примера (табл. 3.1) требуется дать прогноз объема выпуска продукции в течение первого полугодия ближайшег

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги