рефераты конспекты курсовые дипломные лекции шпоры

Раздел Образование
/
Методы регрессионного анализа

Реферат Курсовая Конспект

Выберите учебное заведение

Методы регрессионного анализа

Методы регрессионного анализа - раздел Образование, Методы Регрессионного Анали...

Методы регрессионного анализа

Сущность и задачи регрессионного анализа

В дальнейшем будем рассматривать две модели регрессионного анализа (РА). Модель 1. В данной модели зависимая переменная – случайная величина, а… Модель 2. В данной модели как зависимая переменная, так и независимые переменные являются случайными величинами.…

Однофакторный регрессионный анализ

Модели однофакторного регрессионного комплекса

, соответственно. Данные модели могут быть представлены в несколько иной форме, а именно:

Построение уравнения регрессии

y = f(x). (9.2.6) Эта функция определяется также и вектором числовых параметров (a0, a1,…, ak)т = A<k+1>. (9.2.7)

Проверка адекватности уравнения регрессии

Адекватность уравнения определяется, прежде всего, правильным выбором класса Y функций регрессии. Для проверки соответствия выбранного класса функций регрессии опытным данным… , . (9.2.21)

Проверка значимости коэффициентов регрессии

H0j: aj ¹ 0, при соответствующих конкурирующих гипотезах H1j: aj = 0. В качестве показателя согласованности при проверке гипотез H0j используется выражение

Примеры однофакторного регрессионного анализа

Из вышеизложенного следует, что однофакторный регрессионный анализ проводится в следующей последовательности.

1. Выбирается вид функции регрессии.

2. Составляется система нормальных уравнений.

3. Находится решение системы нормальных уравнений (определяются оценки коэффициентов регрессии).

4. Проверяется адекватность построенного уравнения регрессии экспериментальным данным.

5. Проверяется значимость коэффициентов регрессии.

6. Повторно проверяется адекватность уравнения регрессии после исключения незначимых коэффициентов.

П р и м е р 9.1. Для исследования зависимости выходного сигнала y системы от входного воздействия x проведены испытания, результаты которых сведены в табл.9.3.

Необходимо построить уравнение регрессии y = f(x) в предположении, что оно является алгебраическим полиномом третьей степени. Расчёты произвести в скалярной форме.

Таблица 9.3

Массив экспериментальных данных

x	–2	–1
y					–39

▼ 1. Класс функций Y задан в условии задачи – это полиномы третьей степени

y = a₀x³+ a₁x²+ a₂x + a₃. (9.2.31)

Они являются функциями вида (9.2.11). Для данного случая выражение (9.2.11) представляется как

y = a₀f₀(x) + a₁f₁(x) + a₂f₂(x) + a₃f₃(x), (9.2.32)

где f₀(x) = x³, f₁(x) = x², f₂(x) = x, f₃(x) = 1. (9.2.33)

2. Для функции (9.2.32) и заданного количества опытов система нормальных уравнений (9.2.17) принимает вид

(9.2.34)

С учётом (9.2.33) система уравнений (9.2.34) преобразуется следующим образом:

(9.2.35)

3. Оценки коэффициентов уравнения регрессии (т.е. решение системы линейных уравнений (9.2.35)) находим по формулам (9.2.18):

. (9.2.36)

Развёрнутый вид определителей в соотношениях (9.2.36):

; ;

Составляем расчётную таблицу 9.4 для вычисления коэффициентов системы линейных уравнений (9.2.35).

Таблица 9.4

Расчётная таблица

x_i	y_i

–2			–8		–32		–10		–40
–1			–1		–1		–4		–4


	–39						–117	–351	–1053
= =1	= = –23	= =15	= =19	= =99	= =211	= =795	= = –129	= = –325	= = –1095

Получаем систему уравнений (9.2.35) с числовыми значениями коэффициентов при неизвестных:

Определитель | A | четвёртого порядка вычисляем разложением по первой строке:

При разложении определителя | A | получены четыре определителя третьего порядка, которые вычисляем также разложением по первой строке:

Аналогично находим

;

По формулам (9.2.36) вычисляем оценки коэффициентов регрессии:

Получили уравнение регрессии

4. Проверяем адекватность регрессионной зависимости экспериментальным данным. Для этого необходимо вычислить оценки дисперсий (9.2.25) и (9.2.26). Составляем табл.9.5.

Таблица 9.5

Расчётная таблица

x_i	y_i
–2		9,6	92,16	4,95	0,05	0,0025
–1		8,6	73,96	4,01	–0,01	0,0001
		9,6	92,16	4,97	0,03	0,0009
		6,6	43,56	2,01	–0,01	0,0001
	–39	–34,4		–38,95	–0,05	0,0025

Оценка математического ожидания выходной переменной y, которая используется при расчётах в табл.9.5, найдена по формуле (5.1.1):

Необходимые данные для вычисления оценок дисперсий s² и берём из табл.9.5:

;

Наблюдаемое значение показателя согласованности (9.2.23):

Критическое значение показателя согласованности при уровне значимости a = 0,01 и степенях свободы f₁ = n – 1 = 4, f₂ = n – k – 1 = 1, находим в приложении 5:

F_(0,01;_4;₁₎ = 5625.

Очевидно, что неравенство (9.2.24) выполняется, т.е. F >F_(0,01;_4;₁₎. Следовательно, нулевая гипотеза H₀ о соответствии функции регрессии вида (9.2.31) экспериментальным данным принимается.

5. Проверяем значимость коэффициентов уравнения регрессии.

Для вычисления наблюдаемых значений показателя согласованности (9.2.30) необходимо найти диагональные элементы корреляционной матрицы (9.2.28). В рассматриваемом примере матрица F представляется следующим образом:

. (9.2.37)

Находим произведение транспонированной матрицы F на исходную:

(9.2.38)

Далее требуется найти элементы главной диагонали матрицы :

где – определитель матрицы ; A_ii, – алгебраические дополнения элементов главной диагонали этой же матрицы.

Вычисляем определитель и алгебраические дополнения:

;

Таким образом, имеем

Главная диагональ (9.2.29) корреляционной матрицы вектора оценок коэффициентов регрессии:

Вычисляем оценки средних квадратических отклонений коэффициентов , :

; ;

; .

Находим наблюдаемые значения показателя (9.2.27):

Критическое значение показателя согласованности при уровне значимости a = 0,01 и одной степени свободы f = 1 находим в приложении 6: t_(0,01;₁₎ = 63,7.

Проверяем условие (9.2.30) и получаем:

t₀ > t_(0,01;₁₎; t₁ > t_(0,01;₁₎; t₂ < t_(0,01;₁₎; t₃ > t_(0,01;₁₎.

На основе приведённых неравенств делаем вывод, что коэффициенты a₀, a₁ и a₃ являются значимыми, а коэффициент a₂ принимаем равным нулю.

Окончательный вид уравнения регрессии

6. Проверяем адекватность последнего уравнения по критерию Фишера. Составляем табл.9.6.

Таблица 9.6

Расчётная таблица

x_i	y_i
–2		4,89	0,11	0,0121
–1		3,98	0,02	0,0004
		4,97	0,03	0,0009
		2,04	–0,04	0,0016
	–39	–38,86	–0,14	0,0196

Вычисляем оценку остаточной дисперсии с учётом результата, полученного в табл.9.6:

Общая дисперсия остаётся прежней. Поэтому наблюдаемое значение показателя согласованности (9.2.33) будет следующим:

Очевидно, что при критическом значении показателя согласованности F_(0,01;_4;₁₎ = 5625 неравенство (9.2.24) выполняется. Таким образом, повторная проверка адекватности по критерию Фишера подтверждает справедливость гипотезы о соответствии функции регрессии вида (9.2.31) экспериментальным данным.

▲

П р и м е р 9.2. В условиях примера 9.1 построить уравнение регрессии, но расчёты произвести в матричной форме.

▼ Матричное уравнение (9.2.19) для рассматриваемого примера имеет вид

, (9.2.39)

где матрицы F и представлены выражениями (9.2.37), (9.2.38) соответственно;

; .

Выражение (9.2.20) для вычисления оценок коэффициентов регрессии представляется в виде

. (9.2.40)

Вычисляем обратную матрицу для матрицы

Алгебраические дополнения элементов матрицы :

A₁₁ = 2716; A₂₁ = –3780; A₃₁ = –13384; A₄₁ = 3696;

A₁₂ = –3780; A₂₂ = 8172; A₃₂ = 15480; A₄₂ = –13248;

A₁₃ = –13384; A₂₃ = 126304; A₃₃ = 76576; A₄₃ = –10896;

A₁₄ = 3696; A₂₄ = –13248; A₃₄ = –10896; A₄₄ = 49248.

Определитель указанной матрицы || = 106848.

В результате получили обратную матрицу

Далее вычисляем матрицу в правой части уравнения (9.2.39):

По формуле (9.2.40) находим оценки коэффициентов регрессии

Так же, как и в примере 9.1 при расчётах в скалярной форме, получили уравнение регрессии

Проверка адекватности уравнения экспериментальным данным и значимость коэффициентов регрессии выполняется аналогично тому, как это сделано в примере 9.1.

▲

Многофакторный линейный регрессионный анализ

Модели многофакторного линейного регрессионного анализа

В настоящем подпараграфе рассмотрим модели многофакторного (множественного) регрессионного анализа, являющиеся линейными как относительно… Модель РА-1 определяется выражением , (9.3.1)

Построение уравнения множественной регрессии

(9.3.3) в выражении . (9.3.4)

Проверка адекватности уравнения множественной регрессии

, (9.3.17) где – оценка общей дисперсии наблюдаемой переменной; – оценка остаточной… Оценки дисперсий, входящих в соотношение (9.3.17), определяются по формулам

Селекция факторов

Следуя представленной в указанном подпараграфе схеме, необходимо проверить нулевые гипотезы о неравенстве нулю коэффициентов bj: H0j: bj ¹ 0, . Конкурирующие гипотезы состоят в предположении о равенстве нулю коэффициентов:

Пример многофакторного линейного регрессионного анализа

Из вышеизложенного очевидно, что многофакторный линейный регрессионный анализ проводится в следующей последовательности.

1. Определяется количество слагаемых в линейной функции регрессии вида (9.3.1) или (9.3.2) в зависимости от числа факторов.

2. Выполняется центрирование факторов.

3. Составляется система нормальных уравнений.

4. Находится решение системы нормальных уравнений (определяются оценки коэффициентов регрессии).

5. Проверяется адекватность построенного уравнения регрессии экспериментальным данным.

6. Производится селекция факторов.

7. Повторно проверяется адекватность уравнения регрессии после исключения незначимых факторов.

П р и м е р 9.3. Для исследования зависимости выходного сигнала y системы от входного воздействия X_<2> = (x₁, x₂)^т, проведены испытания, результаты которых сведены в табл.9.9.

Необходимо построить регрессионную зависимость y от X_<2> в предположении, что она является линейным алгебраическим полиномом.

Таблица 9.9

Массив экспериментальных данных

x₁	–0,5		0,8	0,4	0,5	0,6
x₂	–3	–1		0,5	1,5
y	–15,1	–1	19,9	9,5	16,5	47,9

▼ 1. В рассматриваемой задаче функция регрессии представляет собой линейный алгебраический полином от двух независимых переменных

y = b₀ + b₁x₁ + b₂x₂.

2. Составляем таблицу экспериментальных данных с центрированными значениями факторов.

Предварительно вычисляем средние значения факторов:

;

Используя формулы (9.3.5), производим центрирование факторов, результаты заносятся в таб.9.10.

Таблица 9.10

Массив экспериментальных данных с центрированными значениями факторов

	–0,8	–0,3	0,5	0,1	0,2	0,3
	–4	–2		–0,5	0,5
y	–15,1	–1	19,9	9,5	16,5	47,9

Таким образом, вначале коэффициенты регрессии оцениваем в выражении функции (9.3.7), которая для данной задачи принимает вид

(9.3.24)

3. Система нормальных уравнений представляется следующим образом:

(9.3.25)

4. Представим и решим систему (9.3.25) в матричной форме.

Матричное уравнение, эквивалентное данной системе, принимает вид

, (9.3.26)

где ;

; .

Выражение (9.3.16) для вычисления оценок коэффициентов регрессии представляется равенством

. (9.3.27)

Вычисляем матрицу :

Для полученной матрицы находим обратную матрицу:

(9.3.28)

Далее находим матрицу в правой части уравнения (9.3.26):

По формуле (9.3.27) вычисляем оценку вектора коэффициентов регрессии

Получим следующее уравнение регрессии:

. (9.3.29)

5. Проверяем адекватность уравнения (9.3.29) экспериментальным данным.

Предварительно вычисляем оценки дисперсий (9.3.18) и (9.3.19). Для этого составляем табл.9.11.

Таблица 9.11

Расчётная таблица

		y_i
–0,8	–4	–15,1	–28		–15,2	0,01	0,0001
–0,3	–2	–1	–13,9		–0,98	–0,02	0,0004
0,5		19,9			20,3	–0,40	0,16
0,1	–0,5	9,5	–3,4	11,6	9,66	0,16	0,0256
0,2	0,5	16,5	3,6		16,6	–0,10	0,01
0,3		47,9				0,90	0,81

Оценка математического ожидания выходной переменной y, используемая при расчётах в табл.9.11, найдена по формуле (5.1.1):

Необходимые данные для вычисления оценок дисперсий берём из табл.9.11:

, (9.3.30)

Наблюдаемое значение показателя согласованности (9.3.17):

Для отыскания критического значения показателя согласованности при уровне значимости a = 0,01 и степенях свободы f₁ = n – 1 = 5, f₂ = n – k – 1 = 3 используем приложение 5 и получаем F_(0,01;5;3) = 28,24.

Поскольку неравенство (9.3.20) выполняется (F > F_(0,01;5;3)), нулевую гипотезу об адекватности функции регрессии вида (9.3.24) экспериментальным данным принимаем.

6. Выполняем селекцию факторов. Для этого находим элементы главной диагонали корреляционной матрицы (9.3.22). Учитывая выражения (9.3.28) и (9.3.30), имеем

Оценки средних квадратических отклонений коэффициентов , принимают значения:

; ; .

Для каждого фактора находим наблюдаемое значение показателя согласованности (9.3.21):

Для числа степеней свободы f = n – k –1 = 3 и уровня значимости a = 0,01 критическое значение показателя согласованности t_(0,01;3) = 5,84. Следовательно,

t₀ > t_(0,01;3), t₁ < t_(0,01;3), t₃ > t_(0,01;3).

В отношении фактора принимаем конкурирующую гипотезу о его незначимости. Тогда в правой части выражения (9.3.24) второе слагаемое приравниваем к нулю. Поскольку в исходной матрице исключается второй столбец, оценки коэффициентов регрессии b₀ и b₂ необходимо пересчитать.

Пересчёт выполняем в том же порядке, который приведён выше (сохраняем ту же нумерацию пунктов).

1. Функция регрессии в данном случае представляет собой линейный алгебраический полином от одной независимой переменной

y = b₀+ b₂x₂. (9.3.31)

2. Составляем табл.9.12 экспериментальных данных с центрированными значениями фактора x₂.

Таблица 9.12

Массив экспериментальных данных с центрированными значениями фактора

	–4	–2		–0,5	0,5
y	–15,1	–1	19,9	9,5	16,5	47,9

Коэффициенты регрессии предварительно оцениваем в уравнении

. (9.3.32)

3. Система нормальных уравнений принимает вид

(9.3.33)

4. Матричное уравнение, эквивалентное системе (9.3.33), представляется как

, (9.3.34)

где

;

Оценки коэффициентов регрессии определяются равенством

. (9.3.35)

Вычисляем матрицу :

Находим обратную матрицу:

Матрица в правой части уравнения (9.3.33) есть не что иное, как вектор-столбец с двумя компонентами:

Оценку вектора коэффициентов регрессии находим по формуле (9.3.35):

Получим уравнение регрессии с одним фактором

. (9.3.36)

5. Проверяем адекватность уравнения (9.3.36) экспериментальным данным.

Для вычисления оценки дисперсии (9.3.19) составляем расчётную табл.9.13. Оценка дисперсии (9.3.18) остаётся прежней.

Таблица 9.13

Расчётная таблица

	y_i
–4	–15,1	–14,7	–0,4	0,16
–2	–1	–0,9	–0,1	0,01
	19,9	19,8	0,1	0,01
–0,5	9,5	9,4	0,1	0,01
0,5	16,5	16,3	0,2	0,04
	47,9	47,4	0,5	0,25

Получаем оценку остаточной дисперсии:

Показатель согласованности (9.3.17) принимает значение

Критическое значение данного показателя при a = 0,01, f₁ = n – 1 = 5, f₂ = n – k – 1 = 4 составляет F_(0,01;5;4) = 15,52. Поскольку имеет место неравенство F > F_(0,01;5;4), нулевая гипотеза об адекватности функции регрессии (9.3.31) экспериментальным данным принимается.

6. Выполняем селекцию факторов. Главная диагональ корреляционной матрицы (9.3.22) с учётом выражений (9.3.28) и (9.3.30) принимает вид

Из полученного результата следует, что

Наблюдаемые значения показателя согласованности (9.3.21) для факторов и :

Находим критическое значение данного показателя в приложении 6, оно составляет t_(0,01;4) = 4,6. Таким образом,

t₀ > t_{(0,01; 4)}, t₂ > t_(0,01;4).

Принимаем нулевую гипотезу о значимости факторов и в уравнении (9.3.36).

Переходим к уравнению вида (9.3.31) с нецентрированными факторами:

т.е.

или, окончательно

▲

Развернуть

Открыть в широком формате

– Конец работы –

Используемые теги: Методы, регрессионного, анализа0.062

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Методы регрессионного анализа

Что будем делать с полученным материалом:

Если этот материал оказался полезным для Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Еще рефераты, курсовые, дипломные работы на эту тему:

Методы системного анализа. Метод анализа иерархий
украЇнсЬка Інженерно педагогІчНА академІя... Тарасенко О П...

Сравнение эффективности методов сортировки массивов: Метод прямого выбора и метод сортировки с помощью дерева
При прямом включении на каждом шаге рассматриваются только один очередной элемент исходной последовательности и все элементы готовой… Полностью алгоритм прямого выбора приводится в прогр. 3. Таблица 2. Пример… Можно сказать, что в этом смысле поведение этого метода менее естественно, чем поведение прямого включения.Для С имеем…

Методы корреляционного и регрессионного анализа в экономических исследованиях
Исходные данныетребуется проверить на мультиколлинеарность т.е. линейную зависимость междукомпонентами матрицы . Если rxixj gt 0,8 i,j 1 6 i lt gt j… Очем говорит и коэффициент детерминации 45 результативного признака…

Статистические показатели себестоимости продукции: Метод группировок. Метод средних и относительных величин. Графический метод
Укрупненно можно выделить следующие группы издержек, обеспечивающих выпуск продукции: - предметов труда (сырья, материалов и т.д.); - средств труда… Себестоимость является экономической формой возмещения потребляемых факторов… Такие показатели рассчитываются по данным сметы затрат на производство. Например, себестоимость выпущенной продукции,…

Функциональный Методы описательной Методы статистического анализа взаимосвязи признаков
На сайте allrefs.net читайте: Функциональный Методы описательной Методы статистического анализа взаимосвязи признаков...

Бюрократические барьеры для граждан: анализ проблем и методы решения. Анализ на примере ГИБДД МВД РФ.
В этой связи хотелось бы проанализировать довольно-таки непростую ситуацию, сложившеюся процессе взаимодействия граждан, и государства в лице ГИБДД… Многолетние исследования деятельности ДПС (преемник советского ОРУД… Автомобилистам давно известно, что любые действия законодателя по увеличению размеров штрафов, даже в двукратном…

Методы и анализ нелинейного режима работы системы ЧАП. Метод фазовой плоскости
Нелинейная характеристика разбивается на ряд линейных участков, в пределах каждого из которых система описывается линейным дифференциальным… Метод гармонической линеаризации. Нелинейный элемент (НЭ) заменяется его… Состоит в построении и исследовании фазового портрета системы в координатах исследуемой величины и ее производной.…

Методы решения жестких краевых задач, включая новые методы и программы на С++ для реализации приведенных методов
Стр. 8. Второй алгоритм для начала счета методом прогонки С.К.Годунова.Стр. 9. Замена метода численного интегрирования Рунге-Кутта в методе прогонки… Стр. 10. Метод половины констант. Стр. 11. Применяемые формулы… Стр. 62. 18. Вычисление вектора частного решения неоднородной системы дифференциальных уравнений. Стр. 19. Авторство.…

Электрографический метод - метод регистрации и анализа биоэлектрических процессов человека и животных
Так, ни одно кардиологическое исследование не проводится теперь без тщательного анализа электрической активности сердца больного. Ценные… Современные электрографические установки, обеспечивающие многоканальную… В самом деле, если бы электрофизиолог и врач, пользующиеся электрографическим методом, попытались глубоко изучить…

Анализ альтернативных методов формирования структуры организации
Эта курсовая работа посвящена изложению Оригинальной методики анализа альтернативных подходов к формированию структуры организации Глава 3. Тема,… Структура организации понималась как вся внутренняя среда организации в… Цель работы упорядочить знания автора курсовой работы о системном и математическом подходах к управлению и…

0.04

Хотите получать на электронную почту самые свежие новости?

Подпишитесь на Нашу рассылку

Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail

Новости и инфо для студентов

Свежие новости
Актуальные обзоры событий
Студенческая жизнь

Соответствующий теме материал

Похожее
По категориям
По работам

Вычисления в титриметрическом методе анализа основаны на законе эквивалентов, согласно которому вещества реагируют в эквивалентных количествах На сайте allrefs.net читайте: Вычисления в титриметрическом методе анализа основаны на законе эквивалентов, согласно которому вещества реагируют в эквивалентных количествах.
Графические методы анализа переходных процессов в нелинейных цепях Метод графического интегрирования... Метод графического интегрирования основан на графическом подсчете... Контрольные вопросы Какие графические методы применяются для расчета переходных процессов в нелинейных...
Методы расчета и анализа цен на продукцию и услуги На сайте allrefs.net читайте: "Методы расчета и анализа цен на продукцию и услуги"
Анализ техники бега на различные дистанции, анализ техники прыжков в высоту с разбега способами “перешагивание” и “фосбери-флоп" Бег на короткие дистанции. Эти дистанции надо пробегать с максимальной скоростью. На 60м 100м. Быстро выбегать со старта переходит в стремительное ускорение, с… Бег на 200м. Эта дистанция отличается от бега на 60,100м. Прохождением половины дистанции по повороту дорожки. Бег на…
Методы анализа эмпирических данных Цель его состоит в том, чтобы дать научно обоснованную интерпретацию изученных фактов.Собранный первичный материал непригоден для теоретического… Для проведения социологического исследования необходимо: определить виды и… Мы проверяем, насколько верны были исходные предположения, получаем ответы на заданные вопросы и выявляем новые…