Реферат Курсовая Конспект
Оценка надежности результатов множественной регрессии, корреляции и фактора, дополнительно включенного в модель - раздел Финансы, ЛЕКЦИЯ 1 1. Под редакцией И. И. Елисеевой Эконометрика, М,: Финансы и статистика, -2001 г Статистическая Значимость Множественной Регрессии В Целом, Та...
|
Статистическая значимость множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью F-критерия Фишера:
(100)
где Dфакт. - факторная сумма квадратов на одну степень свободы;
Dост. -остаточная сумма квадратов на одну степень свободы;
R2 - коэффициент (индекс) множественной детерминации;
k - число параметров при переменных х ;
n - число наблюдений.
Фактическое значение F – критерия сравнивается с табличным при 5 % - ном уровне значимости и числе степеней свободы: k и n-k-1. Если фактическая величина критерия Фишера больше его табличного значения, то построенная многофакторная модель признается статистически значимой.
В эконометрических исследованиях оценивается значимость не только уравнения в целом, но и фактора, дополнительно включенного в регрессионную модель, т. к. не все факторы могут значительно увеличивать долю объясненной вариации результативного признака, и, кроме того, они могут вводиться в модель в разной последовательности. Мерой для оценки включения фактора в модель служит частный F – критерии, т е. Fxi.
Частный F – критерий оценивает статистическую значимость присутствия каждого фактора в уравнении или, другими словами, оценивает целесообразность включения фактора в модель.
Частный F – критерий построен на сравнении прироста факторной дисперсии, обусловленного влиянием дополнительного включенного фактора, с остаточной дисперсией на одну степень свободы по регрессионной модели в целом.
В общем виде для фактора хi частный F – критерий определится как
(101)
где R2 yx1x2…xp- множественный коэффициент детерминации всего комплекса р факторов с результатом;
R2 yx1x2…xi-1 xi+1…xp - тот же показатель детерминации, но без включения в модель фактора xi.
Предположим, что оценивается значимость влияния х1, как дополнительно
включенного в модель фактора. Используем следующую формулу:
В числителе формулы показан прирост доли объясненной вариации у за счет дополнительного включения в модель фактора х1.
Фактическое (расчетное) значение частного F – критерия сравнивается с табличным при 5 % - ном уровне значимости и числе степеней свободы: 1 и n-k-1. Если фактическое значение частного критерия Фишера Fxi превышает табличное, то дополнительное включение фактора xi в модель статистически оправданно и коэффициент чистой регрессии bi при факторе . х1 статистически значим.
Для двухфакторной модели оценка целесообразности включения одного фактора после другого осуществляется по формулам:
- фактора х1 после фактора х2:
(102)
- фактора х2 после фактора х1:
-
(103)
Если уравнение содержит более двух факторов, например , то определяется последовательно F – критерий для уравнения с 1-ым фактором х1, далее F – критерий для дополнительного включения фактора х2 и, наконец, F – критерий для дополнительного включения в модель фактора х3. в этом случае F – критерий для дополнительного включения фактора х2 является последовательным в отличие от F – критерия для дополнительного включения в модель фактора х3, который является частным F – критерием, ибо оценивает значимость фактора в предположении, что он включен в модель последним.
Оценка статистической значимости коэффициентов чистой регрессии производится с помощью t - критерия Стьюдента по формулам:
или . (104)
mbi- стандартная ошибка коэффициента регрессии bi, она может быть определена по формуле:
(105)
где среднее квадратическое отклонение для признака у;
среднее квадратическое отклонение для признака xi;
R2 yx1x2…xp- множественный коэффициент детерминации всего комплекса р факторов с результатом;
R2 xix1x2… xp - тот же показатель детерминации для зависимости фактора xi со всеми другими факторами уравнения множественной регрессии;
n -k-1 – число степеней свободы для остаточной суммы квадратов отклонений.
Как видим, чтобы воспользоваться данной формулой необходима матрица межфакторной корреляции и расчет по ней соответствующих коэффициентов детерминации: R2xix1…xp.
Так для уравнения оценка значимости коэффициентов регрессии b1, b2, b3 предполагает расчет трех межфакторных коэффициентов детерминации: R2x1,х2х3,, R2x2,х1х3, R2x3,х1х2.
Поэтому проще воспользоваться формулой . С t - критерием Стьюдента связан именно частный критерий Фишера.
Существует взаимосвязь между квадратом частного коэффициента корреляции и частным F – критерием, а именно:
(106)
где квадрат частного коэффициента корреляции фактора xi с у при неизменном уровне всех других факторов;
доля остаточной дисперсии для уравнения регрессии, включающего все факторы, кроме фактора xi ;
доля остаточной дисперсии для уравнения регрессии с полным набором факторов;
Величина F – критерия, оценивая значимость уравнения регрессии в целом, характеризует одновременно и значимость коэффициента (индекса) множественной корреляции.
Аналогично можно оценивать и существенность частных показателей корреляции. Если величина частного критерия Фишера Fxi выше табличного, то это означает и значимость частного коэффициента корреляции.
Фиктивные переменные во множественной регрессии
В регрессионных моделях в качестве объясняющих переменных часто приходится использовать не только количественные (определяемые численно), но и качественные переменные. Это могут быть разного рода атрибутивные признаки, такие например, как профессия, пол, образование, климатические условия, принадлежность к определенному региону. Чтобы ввести такие переменные в регрессионную модель, им должны быть присвоены те или иные цифровые метки, т. е. качественные переменные должны быть преобразованы в количественные. Такого рода переменные принято называть фиктивными переменными. В отечественной литературе можно встретить термин «структурные переменные».
Обычно фиктивная переменная отражает два противоположных состояния качественного фактора. Например, «фактор действует» и «фактор не действует». В этом случае фиктивная переменная может выражаться в двоичной форме:
Например, D = 0, если потребитель не имеет высшего образования, D = 1, если потребитель имеет высшее образование; , D = 0, если в обществе имеются инфляционные ожидания; D = 1, если в обществе инфляционных ожиданий нет.
Переменная D называется фиктивной (искусственной, двоичной) переменной (индикатором)
Таким образом, кроме моделей, содержащих только количественные факторы (х), в регрессионном анализе рассматриваются также модели, содержащие и качественные переменные - D (одни или те и другие одновременно).
Регрессионные модели, содержащие лишь качественные факторы, называются ANOVA – моделями (моделями дисперсионного анализа).
Например, пусть у – начальная заработная плата.
Тогда зависимость можно выразить моделью парной регрессии Очевидно, y(D = 0) =
y(D = 1) =
При этом коэффициент а определяет среднюю заработную плату при отсутствии высшего образования. Коэффициент с указывает, на какую величину отличаются средние начальные заработные платы при наличии и отсутствии высшего образования у претендента. Проверяя статистическую значимость коэффициента с с помощью критерия Стьюдента , либо значимость коэффициента детерминации с помощью критерия Фишера можно определить, влияет или нет наличие высшего образования на начальную заработную плату.
Такие модели в экономике редки. Гораздо чаще встречаются модели, содержащие как количественные, так и качественные переменные.
Такие модели называются ANСOVA – моделями (моделями ковариационного анализа).
Рассмотрим модель с одной количественной и одной качественной переменной, имеющей два альтернативных состояния:
Пусть, например, у –заработная плата сотрудника фирмы; х – стаж сотрудника; D – пол сотрудника, т. е.
Тогда ожидаемое значение заработной платы сотрудников при х годах трудового стажа будет:
y(х, D = 0) =- для женщины.
y(х, D = 1) =- для мужчины.
Заработная плата в данном случае является линейной функцией от стажа работы. Причем, и для мужчин и для женщин заработная плата меняется с одним и тем же коэффициентом пропорциональности β1. а вот свободные члены в моделях отличаются на величину . Проверив, с помощью критерия Стьюдента статистические значимости коэффициентов β0 и (β0 +), можно определить, имеет ли место в фирме дискриминация по половому признаку. Если эти коэффициенты окажутся статистически значимыми, то, очевидно, дискриминация есть, более того, при > 0, она будет в пользу мужчин, при < 0 – в пользу женщин.
В данном случае пол сотрудников имеет два альтернативных значения, и в модели это отражается одной фиктивной переменной,
Если же будут использованы несколько фиктивных переменных с двумя альтернативными значениями, например две,
то модель имеет вид:
где
Но в этой ситуации между фиктивными переменными D1 и D2 существует строгая линейная зависимость: D2 = 1- D1, т, е. имеет место мультиколлинеарность, при которой одну из фиктивных переменных следует исключить.
Поэтому имеется правило: если качественная переменная имеет k альтернативных значений, то при моделировании используются только (k – 1) фиктивных переменных.
Значение качественной переменной, для которого принимается D = 0, называется базовым или сравнительным.
Техника фиктивных переменных может быть распространена на произвольное число качественных факторов. Для простоты рассмотрим ситуацию с двумя качественными переменными.
Пусть у – заработная плата сотрудника фирмы; х – стаж сотрудника;
D1 – наличие высшего образования; D2 – пол сотрудника, т. е.
Таким образом, получим следующую модель:
Из этой модели выводятся следующие регрессионные зависимости.
Средняя заработная плата женщины без высшего образования:
Средняя заработная плата женщины с высшим образованием:
Средняя заработная плата мужчины без высшего образования:
Средняя заработная плата мужчины с высшим образованием:
Очевидно, что все регрессии отличаются лишь свободными членами, Коэффициенты с1 и с2 позволяют убедиться, влияют ли образование и пол сотрудника на его заработную плату.
Предложенные выше схемы могут быть распространены на ситуации с произвольным числом количественных и качественных факторов.
При этом не следует забывать, что если качественная переменная имеет k альтернативных значений, то при моделировании используются только (k – 1) фиктивных переменных
– Конец работы –
Эта тема принадлежит разделу:
СПИСОК ЛИТЕРАТУРЫ... Под редакцией И И Елисеевой Эконометрика М Финансы и статистика г Под редакцией И И Елисеевой Практикум по эконометрике М Финансы и статистика г...
Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Оценка надежности результатов множественной регрессии, корреляции и фактора, дополнительно включенного в модель
Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:
Твитнуть |
Новости и инфо для студентов