рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Основы линейного и нелинейного регрессионного И корреляционного анализов

Основы линейного и нелинейного регрессионного И корреляционного анализов - раздел Образование, Министерство Образования И Науки Российской Федерации...

Министерство образования и науки Российской Федерации

Государственное образовательное учреждение

Высшего профессионального образования

«Брянская государственная инженерно-технологическая
академия»

Кафедра математики

Основы линейного и нелинейного регрессионного

И корреляционного анализов

Методические указания к выполнению
расчетно-графической работы

для студентов всех направлений подготовки бакалавров
очной и заочной форм обучения

 

 

Брянск 2012


Министерство образования и науки Российской Федерации

Государственное образовательное учреждение

Высшего профессионального образования

«Брянская государственная инженерно-технологическая
академия»

Кафедра математики

 

УТВЕРЖДЕНЫ

научно-методическим

советом академии

Протокол № ____

oт “____”__________2012 г.

 

Основы линейного и нелинейного регрессионного

И корреляционного анализов

Методические указания к выполнению
расчетно-графической работы

для студентов всех направлений подготовки бакалавров
очной и заочной форм обучения

 

 

Брянск 2012


 

Авторы:

Баранова Ирина Михайловна, зав. кафедрой математики,

Часова Наталья Александровна, доцент кафедры математики,

Рецензент: профессор каф. физики, к. физ.-мат. наук Евтюхов К. Н.

 

 

Рассмотрены УМК МТФ

Протокол № от


Содержание

1. Основные понятия и задачи. 5

1.1. Основные задачи теории корреляции. 6

1.2. Задачи регрессионного анализа. 6

1.3. Корреляционная таблица. 7

1.4. Выборочное уравнение прямой линии регрессии по сгруппированным данным. Выборочный коэффициент корреляции. 8

1.5. Свойства выборочного коэффициента корреляции. 9

1.6. Точечная и интервальная оценки коэффициентов корреляции
нормально распределенной генеральной совокупности. 11

1.7. Проверка гипотезы о значимости выборочного коэффициента
корреляции. 11

1.8. Корреляционное отношение. 12

1.9. Свойства корреляционного отношения. 13

1.10. Проверка однородности нескольких дисперсий, найденных
по выборкам одинаковых объемов. 14

1.11. Проверка однородности нескольких дисперсий, найденных
по выборкам различного объема. 15

1.12. Проверка адекватности регрессионной модели. 15

1.13. Порядок проверки адекватности модели. 16

1.14. Коэффициент детерминации. 17

2. Пример выполнения расчетно-графической работы.. 19

2.1. Определение основных параметров случайных величин и .. 20

2.2. Построение корреляционной таблицы.. 22

2.3. Проверка однородности дисперсий случайных величин и по критерию Бартлетта. 24

2.4. Построение линейной регрессионной модели. 25

2.5. Точечная и интервальная оценки коэффициента корреляции
генеральной совокупности. 26

2.6. Проверка гипотезы о значимости выборочного коэффициента
корреляции. 26

2.7. Вычисление корреляционных отношений. 27

2.8. Построение квадратичной регрессионной модели по методу
наименьших квадратов. 27

2.9. Нахождение средней квадратической ошибки уравнения. 31

2.10. Интервальные оценки параметров квадратичной линии регрессии генеральной совокупности. 32

2.11. Нахождение коэффициента детерминации. 34

2.12. Проверка адекватности регрессионной модели. 34

Список литературы: 35

 


Основные понятия и задачи

Теория вероятностей и математическая статистика, как и другие разделы математики, изучают явления окружающего мира не непосредственно, а с помощью математических моделей.

Во многих случаях требуется установить и оценить зависимость случайной величины (СВ) от одной или нескольких СВ. Две СВ могут быть связаны функциональной зависимостью, либо зависимостью другого рода, называемой статистической, либо быть независимыми.

При функциональной связи каждому значению одной величины (аргумента) соответствует одно значение другой величины (функции).

Как бы точно не проводился эксперимент, как бы точно не закреплялись условия опыта и побочные факторы, неизбежен некоторый разброс результатов опыта в силу того, что не учтены действия еще многих факторов, то есть между изучаемыми величинами если и есть какая либо связь, то явно не функциональная.

Строгая функциональная зависимость реализуется редко, так как обе величины или одна из них подвержены еще действию случайных факторов, причем среди них могут быть общие для обеих величин (под общими здесь понимают факторы, при которых возникает статистическая зависимость).

Статистической называют зависимость, при которой изменение значения одной из величин влечет за собой изменение значения другой величины. В частности, статистическая зависимость проявляется в том, что при изменении одной величины изменяется среднее значение другой величины. В этом случае статистическую зависимость называют корреляционной.

Введем понятие условной средней.

Определение. Условной средней называют среднее арифметическое значений , соответствующих значению .

Если каждому значению соответствует одно значение условной средней, то условная средняя есть функция от . В этом случае говорят, что случайная величина зависит от корреляционно.

Определение. Корреляционной зависимостью от называется функциональную зависимость условной средней от , то есть . Это уравнение регрессии на . Функцию называют регрессией на , а ее график – линией регрессии на .

Определение. Условной средней называют среднее арифметическое значений X, соответствующих значению .

Определение. Корреляционной зависимостью от называют функциональную зависимость условной средней от , то есть . Это уравнение регрессии на . Функцию называют регрессией на , а ее график – линией регрессии на .

Основные задачи теории корреляции

2. Оценить тесноту корреляционной связи. Теснота корреляционной зависимости оценивается по величине рассеивания значения вокруг условной средней…

Задачи регрессионного анализа

Регрессионный анализ – анализ функции регрессии. С его помощью решаются следующие задачи:

1. Находят точечные и интервальные оценки параметров элементарной функции регрессии.

2. Производят точечные и интервальные оценки, необходимые для предсказания средних значений одной случайной величины, соответствующие функциональной зависимости от другой величины.

3. Производят согласование найденной элементарной функции с экспериментальными данными.

Корреляционная таблица

При большом количестве наблюдений одного и того же значения, значение может встретиться раз, одно и то же значение раз. Одна и та же пара чисел может встретиться раз. Поэтому данные наблюдений группируются, то есть подсчитываются частоты , , .

Все сгруппированные данные записываются в виде таблицы, которую называют корреляционной. Интервалы одной случайной величины записывают в первый столбец корреляционной таблицы, а интервалы другой случайной величины – в первую строку.

По каждой паре значений решают в какую строку и в какой столбец они попадают. В клетку, стоящую на пересечении соответствующих строки и столбца, ставят точку. Так поступают со всеми парами чисел . Затем подсчитывают точки во всех клетках и записывают соответствующим числом .

Далее суммируют числа по строкам и столбцам и находим и .

Замечание. .

Для каждого столбца необходимо найти условное среднее , а для каждой строки .

Выборочное уравнение прямой линии регрессии по сгруппированным данным. Выборочный коэффициент корреляции

(1) где – коэффициент регрессии. Пусть получено большое число данных (для удовлетворительной оценки искомых параметров количество наблюдений должно…

Свойства выборочного коэффициента корреляции

2. Если выборочный коэффициент корреляции равен 0 и выборочные линии регрессии – прямые линии, то и не связаны линейной корреляционной зависимостью… В этом случае прямые линии регрессии параллельны соответственно координатным… Замечание. Если выборочный коэффициент корреляции , то признаки и могут быть связаны нелинейной корреляционной или…

Точечная и интервальная оценки коэффициентов корреляции нормально распределенной генеральной совокупности

Если выборка имеет достаточно большой объем и хорошо представляет генеральную совокупность, то заключение о тесноте линейной зависимости между признаками, полученное по данным выборки, в известной степени может быть распространено на генеральную совокупность. В качестве точечной оценки коэффициента корреляции генеральной совокупности берут .

Для интервальной оценки коэффициента корреляции нормально распределенной генеральной совокупности () имеем:

. (8)

Проверка гипотезы о значимости выборочного коэффициента корреляции

Так как выборка отобрана случайно, то еще нельзя заключить, что коэффициент корреляции генеральной совокупности также отличен от 0. Нас интересует именно этот коэффициент . Поэтому возникает необходимость при… Если гипотеза будет опровергнута, то это означает, что выборочный коэффициент корреляции значительно отличается от 0,…

Корреляционное отношение

Так как все значения признака разбиты на группы, можно представить общую дисперсию признака в виде суммы внутригрупповой и межгрупповой дисперсии. … . (9) Определение. Групповой дисперсией называют дисперсию значений признака, принадлежащих группе, относительно групповой…

Свойства корреляционного отношения

1) .

2) Если , то признак с признаком корреляционной зависимостью не связан.

3) Если , то признак с признаком связан функциональной зависимостью.

4) Выборочное корреляционное отношение не менее абсолютной величины выборочного коэффициента корреляции: .

5) Если выборочное корреляционное отношение равно абсолютной величине выборочного коэффициента корреляции, то имеет место точная линейная корреляционная зависимость.

Проверка однородности нескольких дисперсий, найденных по выборкам одинаковых объемов

Пусть – количество выборочных дисперсий, однородность которых проверяется. Обозначим эти дисперсии . Вычисляется расчетное – отклонение по формуле: . (16)

Проверка однородности нескольких дисперсий, найденных по выборкам различного объема

Предварительно вычисляют дисперсию воспроизводимости , представляющую собой среднее взвешенное значение дисперсий, взятое с учетом числа степеней… , (17) где – число степеней свободы соответствующих дисперсий, – сумма всех степеней свободы: .

Проверка адекватности регрессионной модели

Проверка адекватности математической модели дает возможность экспериментатору ответить на вопрос, будет ли построенная модель предсказывать значения… Пусть – число опытов экспериментального плана или число серий параллельных… Проверка адекватности возможна только при , т.е. если план эксперимента является ненасыщенным.

Порядок проверки адекватности модели

, где – число дублированных опытов в каждой серии, – среднее значение… В случае неравномерного дублирования

Коэффициент детерминации

Коэффициент детерминации интегрально характеризует точностные свойства уравнения регрессии. Он показывает, какая доля из общего рассеяния… , (21) где – теоретическое значение результативного признака, вычисленное с помощью полученной регрессионной модели, –…

Пример выполнения расчетно-графической работы

 

Данные для статистической обработки

Столбец 1 Столбец 2 Столбец 3 Столбец 4 Столбец 5
8,91 7,36 9,10 9,80 8,43 10,10 7,45 9,01 8,07 8,86 560,47 395,40 583,13 668,37 506,74 706,87 404,02 571,92 467,60 554,50 10,19 10,71 9,68 9,33 8,93 9,03 10,11 7,46 9,30 8,62 718,20 788,63 653,88 610,69 562,38 574,46 708,69 405,15 606,14 526,98 8,92 7,33 8,63 9,24 8,66 8,44 9,54 8,02 8,62 8,12 561,67 392,71 528,04 599,47 532,26 507,66 636,39 462,43 527,94 472,49 9,73 8,43 7,95 9,89 9,93 8,49 6,75 8,38 8,72 9,57 659,48 506,18 454,53 680,49 684,68 512,47 338,21 501,19 539,20 639,34 9,96 9,42 9,24 9,56 8,29 7,13 9,42 9,84 8,06 8,67 689,24 621,28 598,93 638,56 491,13 373,06 621,16 673,62 466,31 532,75
Столбец 6 Столбец 7 Столбец 8 Столбец 9 Столбец 10
8,98 8,43 9,04 10,60 9,63 10,97 8,77 9,07 8,91 10,38 568,23 506,65 575,46 773,63 646,83 824,15 543,87 579,56 560,95 743,22 9,31 9,29 9,04 10,13 9,68 8,66 8,88 9,43 8,81 8,20 608,14 605,72 576,15 710,49 653,68 531,79 557,32 622,92 548,98 480,97 10,43 8,97 9,18 10,33 10,04 9,14 10,22 9,10 8,25 8,66 750,59 567,78 592,59 736,87 699,34 587,48 723,08 583,02 486,95 531,98 9,68 10,50 9,51 9,88 8,16 8,98 8,13 7,21 9,33 10,60 653,25 759,24 631,76 679,17 476,74 568,97 474,10 381,13 610,68 774,19 8,99 9,13 9,14 10,25 6,84 8,72 10,35 8,12 9,94 7,41 570,25 586,56 587,68 726,99 346,08 538,49 739,89 472,21 686,47 400,57

 


2.1. Определение основных параметров случайных величин
и

Возьмем некоторые данные для случайной величины из расчетно-графической работы №1. Интервальный ряд для СВ :

№ п/п Интервалы Середина интервала Частота
[6,75; 7,18) 6,97
[7,18; 7,61) 7,40
[7,61; 8,04) 7,83
[8,04; 8,47) 8,26
[8,47; 8,9) 8,69
[8,9; 9,33) 9,12
[9,33; 9,76) 9,55
[9,76; 10,19) 9,98
[10,19; 10,62) 10,41
[10,62; 11,05) 10,84

 

Среднее арифметическое наблюдаемых значений случайной величины X: 9,0548. Дисперсия0,7988. Среднеквадратическое отклонение: 0,89.

Используя критерий Пирсона, получаем, что случайная величина распределена по нормальному закону.

Построим интервальный ряд для случайной величины . Весь диапазон измерений признака , где и – соответственно максимальное и минимальное значение признака , разбивают на интервалов, где . Найдем оптимальную длину интервалов:

. ymax=824,15, ymin=338,21, h=(824,15–338,21)/10=48,6.

Получаем интервальный статистический ряд следующего вида:

 

№ п/п Интервалы Середины интервала Частоты
[338,21; 386,81) 362,51
[386,81; 435,41) 411,11
[435,41; 484,01) 459,71
[484,01; 532,61) 508,31
[532,61; 581,21) 556,91
[581,21; 629,81) 605,51
[629,81; 678,41) 654,11
[678,41; 727,01) 702,71
[727,01; 775,61) 751,31
[775,61;824,21) 799,91

Среднее арифметическое наблюдаемых значений случайной величины Y:

=58023,80/100=580,238.

Дисперсия: =D*(Y)==1112388,68/100=11123,8868. Среднеквадратическое отклонение: =105,4698.

Проверим нулевую гипотезу о нормальном виде распределения : , где . Проверку гипотезы о виде нормального распределения можно провести с помощью критерия Пирсона . Для чего нам потребуется следующая таблица:

yi ni yi j(ti) (ti)
362,51 –217,73 –2,06 0,0478 2,2997
411,11 –169,13 –1,60 0,1109 5,3354
459,71 –120,53 –1,14 0,2083 10,0214
508,31 –71,93 –0,68 0,3166 15,2317
556,91 –23,33 –0,22 0,3894 18,7341
605,51 25,27 0,24 0,3876 18,6476
654,11 73,87 0,70 0,3123 15,0248
702,71 122,47 1,16 0,2036 9,7953
751,31 171,07 1,62 0,1074 5,1670
799,91 219,67 2,08 0,0459 2,2083

=

Найдем , a – уровень значимости (a=0.05), n –число степеней свободы n=l–r–1. Так как l=8–2–1=5, то (0.05,5)=11.1.

Сравним и : <, следовательно, нет оснований отвергнуть гипотезу о нормальном распределении случайной величины Y.

Построение корреляционной таблицы

    X Y [6,75; 7,18) [7,18; 7,61) [7,61;… 2.3. Проверка однородности дисперсий случайных величин и по критерию Бартлетта

Построение линейной регрессионной модели

По формуле (5) определим выборочный коэффициент корреляции, для чего сначала вычислим = 534309,8911. rв==0,9458.

Точечная и интервальная оценки коэффициента корреляции генеральной совкупности

Точечная оценка: , ;

Интервальная оценка (8):

0,9458–rг£0,9458+;

0,9142£rг£0,977449.

 

Проверка гипотезы о значимости выборочного коэффициента корреляции

. Найдем , где – уровень значимости, – число степеней свободы; . Сравним и : –…

Вычисление корреляционных отношений

Вычислим по формуле (14) корреляционное отношение .

1066412,721/100=10664,12721;

=103,2673;

.

Аналогично находим по формуле (15).

1/100*77,47869723=0,774787;;

.

Следовательно, связан с корреляционной зависимостью.

Построение квадратичной регрессионной модели по методу наименьших квадратов

(22) Найденные из этой системы выборочные параметры , , подставляют в выборочное… Составим расчетную таблицу № …

Нахождение средней квадратической ошибки уравнения

, где , (23) – фактические значения результативного признака, полученного по данным… Средняя квадратическая ошибка уравнения регрессии: .

Интервальные оценки параметров квадратичной линии регрессии генеральной совокупности

В данном случае , , отсюда . Оценки коэффициентов определяются формулами ,

Нахождение коэффициента детерминации

Коэффициент детерминации, интегрально характеризующий точностные свойства уравнения регрессии, определяем по формуле (21).

, , ,

.

Сравним с . , следовательно, полученная регрессионная модель работоспособна.

Проверка адекватности регрессионной модели

Найдем дисперсию адекватности , где ; . Получим .

– Конец работы –

Используемые теги: основы, ного, нели, ного, регрессионного, корреляционного, анализов0.107

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Основы линейного и нелинейного регрессионного И корреляционного анализов

Что будем делать с полученным материалом:

Если этот материал оказался полезным для Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Еще рефераты, курсовые, дипломные работы на эту тему:

Анализ и поиски путей совершенствования работы предприятия "Фортуна" на основе экспертного анализа работы предприятий автосервиса
Увеличение масштабов производства автомобилей приводит к росту абсолютного объема ремонтных работ, и, как следствие этого, к росту предприятий,… Особенно большой приток автомобильного транспорта наблюдается по Приморскому… Требования, предъявляемые к их обслуживанию и ремонту, стали значительно выше. Эффективность работы автомобиля в…

Методы и анализ нелинейного режима работы системы ЧАП. Метод фазовой плоскости
Нелинейная характеристика разбивается на ряд линейных участков, в пределах каждого из которых система описывается линейным дифференциальным… Метод гармонической линеаризации. Нелинейный элемент (НЭ) заменяется его… Состоит в построении и исследовании фазового портрета системы в координатах исследуемой величины и ее производной.…

Основы планирования. Теоретические основы управления проектами. Основы планирования. Планирование проекта в MS Project 7
Использованная литература В В Богданов Управление проектами в Microsoft Project Учебный курс Санкт Петербург Питер г...

Методы корреляционного и регрессионного анализа в экономических исследованиях
Исходные данныетребуется проверить на мультиколлинеарность т.е. линейную зависимость междукомпонентами матрицы . Если rxixj gt 0,8 i,j 1 6 i lt gt j… Очем говорит и коэффициент детерминации 45 результативного признака…

Анализ хозяйственной деятельности предприятия на основе статистических расчетов
IV. Оборотные средства. Себестоимость. 13. Расчет влияния факторов на фондоотдачу 14. Анализ структуры оборотных средств 15. Анализ влияния объема…

Аппроксимация характеристик нелинейных элементов и анализ цепей при гармонических воздействиях
Особенностью НЭ, по сравнению с линейными, является зависимость параметров НЭ от величины приложенного напряжения или силы протекающего тока.… Важным свойством нелинейных электрических цепей является возможность… Это связано с необходимостью перемножения двух сигналов при реализации таких устройств, как преобразователи частоты,…

НЕЙРОПСИХОЛОГИЯ: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ И ПРАКТИЧЕСКОЕ ЗНАЧЕНИЕ. Нейропсихологаческий анализ нарушений высших психических функций при локальных поражениях мозга
КЛАССИЧЕСКИЙ... УНИВЕРСИТЕТСКИЙ УЧЕБНИК... основано в году по инициативе ректора МГУ им М В Ломоносова академика РАН В Л Садовничего...

Постановка задачи линейного программирования и двойственная задача линейного программирования.
Всвязи с развитием техники, ростом промышленного производства и с появлением ЭВМвсе большую роль начали играть задачи отыскания оптимальных решений… Именно в силу этого процесс моделированиячасто носит итеративный характер. На… Здесь имеется полная аналогия с тем, как весьма важнаи зачастую исчерпывающая информация о поведении произвольной…

Синергетика: становление нелинейного мышления
На сайте allrefs.net читайте: Русский Гуманитарный Интернет Университет...

ОСНОВИ ТЕОРIЇ КIЛ, ОСНОВИ РАДІОЕЛЕКТРОНІКИ
МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ... ХАРКІВСЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ РАДІОЕЛЕКТРОНІКИ...

0.035
Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • По категориям
  • По работам