рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Множественная линейная регрессия

Множественная линейная регрессия - раздел Философия, ПЛАНИРОВАНИЕ И ОРГАНИЗАЦИЯ ЭКСПЕРИМЕНТА Множественная Регрессия – Уравнение Связи С Несколькими Независимыми Переменн...

Множественная регрессия – уравнение связи с несколькими независимыми переменными:

где - зависимая переменная (результативный признак);

- независимые переменные (факторы).

Для построения уравнения множественной регрессии чаще используются следующие функции:

линейная –

степенная –

экспонента –

гипербола - .

Можно использовать и другие функции, приводимые к линейному виду.

Для оценки параметров уравнения множественной регрессии применяют метод наименьших квадратов (МНК). Для линейных уравнений и нелинейных уравнений, приводимых к линейным, строится следующая система нормальных уравнений, решение которой позволяет получить оценки параметров регрессии:

Для ее решения может быть применен метод определителей:

, ,…, ,

где - определитель системы;

- частные определители; которые получаются путем замены соответствующего столбца матрицы определителя системы данными левой части системы.

Другой вид уравнения множественной регрессии – уравнение регрессии в стандартизированном масштабе:

где - стандартизированные переменные;

- стандартизированные коэффициенты регрессии.

К уравнению множественной регрессии в стандартизированном масштабе применим МНК. Стандартизированные коэффициенты регрессии (- коэффициенты) определяются из следующей системы уравнений:

.

Связь коэффициентов множественной регрессии со стандартизированными коэффициентами описывается соотношением

Параметр определяется как .

Средние коэффициенты эластичности для линейной регрессии рассчитываются по формуле

Для расчета частных коэффициентов эластичности применяется следующая формула:

.

Тесноту совместного влияния факторов на результат оценивает индекс множественной корреляции:

Значение индекса множественной корреляции лежит в пределах от 0 до 1 и должно быть больше или равно максимальному парному индексу корреляции:

Индекс множественной корреляции для уравнения в стандартизированном масштабе можно записать в виде

При линейной зависимости коэффициент множественной корреляции можно определить через матрицу парных коэффициентов корреляции:

---- определитель матрицы парных коэффициентов корреляции;

------ определитель матрицы межфакторной корреляции.

Частные коэффициенты (или индексы) корреляции, измеряющие влияние на y фактора при неизменном уровне других факторов, можно определить по формуле:

или по рекуррентной формуле:

.

Частные коэффициенты корреляции изменяются в пределах от –1 до 1.

Качество построенной модели в целом оценивает коэффициент (индекс) детерминации. Коэффициент множественной детерминации рассчитывается как квадрат индекса множественной корреляции:

Скорректированный индекс множественной детерминации содержит поправку на число степеней свободы и рассчитывается по формуле:

где n-число наблюдений;

m – число факторов.

Значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера:

Частный F-критерий оценивает статистическую значимость присутствия каждого факторов в уравнении. В общем виде для фактора частный F-критерий определится как

Оценка значимости коэффициентов чистой регрессии с помощью t-критерия Стьюдента сводится к вычислению значения

где - средняя квадратичная ошибка коэффициента регрессии она может быть определена по следующей формуле:

При построении уравнения множественной регрессии может возникнуть проблема мультиколлинеарности факторов, их тесной линейной связанности.

Считается, что две переменные явно коллинеарны, т. е. находятся между собой в линейной зависимости, если

По величине парных коэффициентов корреляции обнаруживается лишь явная коллинеарность факторов. Наибольшие трудности в использовании аппарата множественной регрессии возникают при наличии мультиколлинеарности факторов. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью метода наименьших квадратов.

Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами.

Если бы факторы не коррелировали между собой, то матрица парных коэффициентов корреляции между факторами была бы единичной матрицей, поскольку все недиагональные элементы были бы равны нулю. Так, для включающего три объясняющих переменных уравнения

матрица коэффициентов корреляции между факторами имела бы определитель, равный 1:

так как и .

Если же, наоборот, между факторами существует полная линейная зависимость и все коэффициенты корреляции равны 1, то определитель такой матрицы равен 0:

.

Чем ближе к 0 определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. И наоборот, чем ближе к 1 определитель матрицы межфакторной корреляции, тем меньше мультиколлинеарность факторов.

Проверка мультиколлинеарности факторов может быть проведена методом испытания гипотезы о независимости переменных . Доказано, что величина имеет приближенное распределение с степенями свободы. Если фактическое значение превосходит табличное (критическое) , то гипотеза отклоняется. Это означает, что , недиагональные ненулевые коэффициенты корреляции указывают на коллинеарность факторов. Мультиколлинеарность считается доказанной.

Для применения МНК требуется, чтобы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора остатки имеют одинаковую дисперсию. Если это условие не соблюдается, то имеет место гетероскедастичность.

При нарушении гомоскедастичности мы имеем неравенства

При малом объеме выборки для оценки гетероскедастичности может использоваться метод Гольдфельда-Квандта. Основная идея теста Гольдфельда-Квандта состоит в следующем:

1) упорядочение наблюдений по мере возрастания переменной ;

2) исключение из рассмотрения центральных наблюдений; при этом

-число оцениваемых параметров;

3) разделение совокупности из наблюдений на две группы (соответственно с малыми и с большими значениями фактора ) и определение по каждой из групп уравнений регрессии;

4)определение остаточной суммы квадратов для первой и второй групп и нахождение их отношения: .

При выполнении нулевой гипотезы о гомоскедастичности отношение R будет удовлетворять F-критерию со степенями свободы для каждой остаточной суммы квадратов. Чем больше величина R превышает табличное значение F-критерия, тем более нарушена предпосылка о равенстве дисперсий остаточных величин.

Уравнения множественной регрессии могут включать в качестве независимых переменных качественные признаки (например, профессия, пол, образование, климатические условия, отдельные регионы и т. д.). Чтобы ввести такие переменные в регрессионную модель, их необходимо упорядочить и присвоить им те или иные значения, т. е. качественные переменные преобразовать в количественные.

Такого вида сконструированные переменные принято в эконометрике называть фиктивными переменными.

Коэффициент регрессии при фиктивной переменной интерпретируется как среднее изменение зависимой переменной при переходе от одной категории к другой при неизменных значениях остальных параметров. На основе t-критерия Стьюдента делается вывод о значимости влияния фиктивной переменной, существенности расхождения между категориями.

Множественная линейная регрессия представляет собой выражение

Для случая =2 по результатам наблюдений система нормальных уравнений, полученная МНК, будет иметь вид

Дальнейшие рассуждения удобно вести, используя следующие матричные обозначения:

- вектор наблюденния - вектор параметров

- регрессионная матрица (nk+1)

Система нормальных уравнений имеет вид . При условии, что – невырожденная матрица, решение системы можно записать в виде

Ковариационная матрица оценок параметров регрессионной модели будет равна

Дисперсии параметров модели определяются соотношением

Во множественной линейной регрессии предпосылки регрессионного анализа и его проведение полностью совпадают с простой линейной регрессией. Особенностью множественной регрессии является корреляция независимых переменных. Желательно избегать включения в модель линейно зависимых переменных.

Линейное уравнение множественной регрессии y от х1 и х2 имеет вид: . Для расчета его параметров применим метод стандартизации переменных и построим искомое уравнение в стандартизованном масштабе: .

Расчет b-коэффициентов выполним по формулам

Для построения уравнения в естественной форме рассчитаем и , используя формулы для перехода от к :

Значение определим из соотношения

Для характеристики относительной силы влияния и на рассчитаем средние коэффициенты эластичности:

С увеличением средней заработной платы на 1% от ее среднего уровня средний душевой доход возрастает на 1,02% от своего среднего уровня; при повышении среднего возраста безработного на 1% среднедушевой доход снижается на 0,87% от своего среднего уровня. Очевидно, что сила влияния средней заработной платы на средний душевой доход оказалась больше, чем сила влияния среднего возраста безработного . К аналогичным выводам о силе связи приходим при сравнении модулей значений и :

.

Различия в силе влияния фактора на результат, полученные при сравнении и , объясняются тем, что коэффициент эластичности исходит из соотношения средних: а -коэффициент - из соотношения средних квадратических отклонений:.

2. Линейные коэффициенты частной корреляции здесь рассчитываются по рекуррентной формуле:

;

;

.

Расчет линейного коэффициента множественной корреляции выполним с использованием коэффициентов и :

.

Зависимость от и характеризуется как тесная, в которой 72% вариации среднего душевого дохода определяются вариацией учтенных в модели факторов: средней заработной платы и среднего возраста безработного. Прочие факторы, не включенные в модель, составляют соответственно 28% от общей вариации .

 

– Конец работы –

Эта тема принадлежит разделу:

ПЛАНИРОВАНИЕ И ОРГАНИЗАЦИЯ ЭКСПЕРИМЕНТА

Государственное образовательное учреждение... Высшего профессионального образования... МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ТЕКСТИЛЬНЫЙ...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Множественная линейная регрессия

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Определение фактора
Фактором называется измеряемая переменная ве­личина, принимающая в некоторый момент времени определенное значение. Факторы соответствуют способам воз­действия на объект исследования. Также

Требования, предъявляемые к факторам при планировании эксперимента
При планировании эксперимента факторы должны быть управляемыми. Это значит, что экспери­ментатор, выбрав нужное значение фактора, может его поддерживать постоянным в течение всего опыта, т. е. може

Требования к совокупности факторов
При планировании эксперимента обычно одно­временно изменяется несколько факторов. Поэтому очень важно сформулировать требования, которые предъяв­ляются к совокупности факторов. Прежде всего, выдви­

Представление результатов экспериментов
  Геометрическое представление функции отклика в факторном пространстве Х1, Х2, …, Хn называется поверхностью отклика (рис. 2).

Факторов
  Если заранее не известно аналитическое выражение функции отклика, то можно рассматривать не саму функцию, а ее разложение, например в степенной ряд в виде полинома

Однофакторный факторный эксперимент
В однофакторном планировании влияние входных параметров (факторов) на выходной параметр изучается постепенно, причем в серии опытов меняется уровень лишь одного фактора, а остальные остаются

Регрессионный анализ
В регрессионном анализе изучается связь и определяется количественная зависимость между зависимой переменной и одной или несколькими независимыми переменными. При решении многих инженерных

Метод наименьших квадратов
Метод наименьших квадратов — один из методов регрессионного анализа для оценки неизвестных величин по результатам измерений, содержащим случайные ошибки. Метод наименьших квадратов применя

Регрессионные модели первого и второго порядка
Уравнением регрессии Y от X называют функциональную зависимость у=f(x), а ее график – линией регрессии. При обработке экспериментальных данных одной из важных задач является задача определ

Построение графиков
Excel позволяет создавать диаграммы и графики довольно приемлемого качества. Excel имеется специальное средство — Мастер диаграмм, под руководством которого пользователь проходит все четыре этапа п

Построение линий тренда
Для получения математической модели необходимо построить на графике линию тренда. В Excel 2003 и 2007 нужно щелкнуть правой кнопкой мыши на точки графика. Тогда в Excel 2003 появится вкладка с пере

Линейная функция
Функция аргумента х, имеющая вид у=ах+b, где а и b – некоторые заданные числа, называется линейной. Ее графиком является прямая линия, которая наклонена к оси х п

Логарифмическая, степенная и экспоненциальная функции
  Экспоненциальная функция y=a.ebx где a и b – расчетные коэффициенты, e – основание натурального логарифм

Полиномиальная функция
  Полиномиальная функция 2 порядка у=а1.х2+а2.х+а3 где а1, а2, а

Проверка адекватности модели
Для проверки гипотезы адекватности модели необходимо сравнить две суммы квадратов: 1) Остаточную сумму квадратов, характеризующую отклонение от регрессии

Проверка значимости параметров модели и ее адекватности
  В результате проверки устанавливается статистическая значимость или незначимость отличия от нуля оценок параметров регрессии. Это проверка осуществляется отдельно для каждого параме

Некоторые нелинейные модели, сводящиеся к линейным
Основной задачей при определении вида математической модели исследуемого процесса является наиболее точное отображение общей тенденции зависимости Y от X. Общий вид математической мод

Полиномиальная модель
Для определения степени полинома используют метод тождественности разделенных или неразделенных разностей. Если в результате эксперимента получены следующие пары значений

Регрессия в программе Excel
  Статистическая обработка данных может также проводиться с помощью надстройки Пакет анализа в подпункте меню «Сервис». В программе Excel 2003, если открыв СЕРВИС, не находим в

Корреляционный анализ
Корреляционный анализ - метод, позволяющий обнаружить зависимость между несколькими случайными величинами. Допустим, проводится независимое измерение различных параметров у одного т

Полный факторный эксперимент
Эффективное решение научных и прикладных задач исследований различных процессов и явлений предполагает учет, по возможности, всей совокупности факторов и их взаимных связей, оказывающих влияние на

Планирование ПФЭ.
Перед началом эксперимента необходимо построить его план, т.е. определить, какие сочетания уровней факторов следует реализовать и в каком порядке осуществить планирование и рандомизацию повторных о

Выбор факторов
При выборе факторов нужно выполнять сле­дующие требования: 1) фактор должен быть регулируемым, т. е. с помощью опреде­ленного регулирующего устройства фактор можно изменять от зна­чения x1

Эксперимента
  При матричной записи результатов различных N опытов для полиномиального представления результата

Ортогональное планирование эксперимента
  Структура матрицы С играет важную роль в реализации алгоритма определения коэффициентов аппроксимирующего полинома. Структура матрицы С зависит от

Планы второго порядка
  Они позволяют сформировать функцию отклика в виде полного квадратичного полинома, который содержит большее число членов, чем неполный квадратичный полином, сформированный по планам

Второго порядка
  Ортогональным планом называется такой план, у которого матрица планирования Х строится так, что бы матрица С=ХtХ оказалась диагональной.

Планы второго порядка с единичной областью планирования
  Так как ОЦКП и РОЦКП - композиционные планы, то при естественной области планирования “звездные” точки могут выходить за пределы единичного гиперкуба и единичного гипершара. Для впи

Рототабельные планы
  Рототабельные планы – это планы, у которых точки плана располагаются на окружностях (сферах, гиперсферах). У рототабельного плана первого порядка точки плана располагаются на одной

Рототабельный ортогональный центрально-композиционный план
  Рототабельный ортогональный центрально-композиционный план (РОЦКП) строится аналогично рассмотренному ранее ОЦКП. К использованному в качестве ядра плану ПФЭ 2n добавляют

Рототабельный план на основе правильного многоугольника при n=2
  U x0 x1 x2 x3=x1x2 x

Композиционные планы
Применение линейных планов совместно с методом градиентного поиска оптимума позволяет достичь окрестностей точки оптимума. Поиск оптимального решения в этой области требует перехода от линейных мод

Планы для экспериментирования в условиях дрейфа
Блочные планы, ортогональные к дискретному дрейфу, пред­ставляют собой обычные планы типа ПМА, сбалансированные так, чтобы часть столбцов плана использовалась для оценки эффектов дискретного дрейфа

Сравнение нескольких дисперсий нормальных генеральных совокупностей по выборкам различного объема. Критерий Бартлетта.
Н0: D(X1)=D(X2) =D(X3)=… =D(Xl) Введем обозначения ki=ni-1 – число степеней свободы дисперсии S2

Дисперсионный анализ
При исследовании однотипных величин возникают задачи их сравнения. Сравнение случайных величин производится путем сопоставления законов распределения или их моментов. Законы распределения

Однофакторный дисперсионный анализ
Это средство служит для анализа дисперсии по данным двух или нескольких выборок. При анализе гипотеза о том, что каждый пример извлечен из одного и того же базового распределения вероятности, сравн

Проверка значимости оценок коэффициентов модели
Проверка значимости оценок коэффициентов полинома производится на основе проверки статистической гипотезы о равенстве математического ожидания случайной величины нулю, т.е. проверки условия b

Проверка адекватности модели
  Проверка адекватности математической модели данным эксперимента проводится только в случае ненасыщенного планирования на основе сопоставления дисперсии воспроизводимости среднего зн

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги