рефераты конспекты курсовые дипломные лекции шпоры

Раздел Информатика
/
Выборочное уравнение линейной регрессии. Метод наименьших квадратов

Реферат Курсовая Конспект

Выберите учебное заведение

Выборочное уравнение линейной регрессии. Метод наименьших квадратов

Выборочное уравнение линейной регрессии. Метод наименьших квадратов - раздел Информатика, Кафедра математики и информатики. Практикум При Проведении Современных Клинических Исследований Обычно Нет Недостатка В И...

При проведении современных клинических исследований обычно нет недостатка в информации: каждому пациенту соответствует целое множество различных клинических показателей и данных.

В них могут быть завуалированы некоторые соотношения, основные черты которых и позволяют выявлять методы регрессионного анализа.

При этом задача регрессионного анализа состоит в подборе упрощенной аппроксимации этой связи с помощью математической модели.

Регрессионный анализ имеет в своем распоряжении специальные процедуры проверки, является ли выбранная математическая модель адекватной для описания имеющихся данных.

Чаще всего регрессионный анализ используется для прогноза, то есть предсказания значений ряда зависимых переменных по известным значениям других переменных.

Выше указывалось, что результаты наблюдений, приведенные в двумерной выборке:

x_i	x₁	x₂	x₃	x₄	x₅
y_i	y₁	y₂	y₃	y₄	y₅

можно представить в виде корреляционного поля точек (рис. 14.3), где каждая точка соответствует отдельным значениям х и у.

Рис. 14.3. Метод наименьших квадратов

В результате получается диаграмма рассеяния, позволяющая судить о форме и тесноте связи между варьирующими признаками. Довольно часто эта связь может быть аппроксимирована прямой линией (рис. 14.3).

Регрессия - это функция, позволяющая по величине одного признака X находить среднее ожидаемое (должное) значение другого признака Y, корреляционно связанного с X.

В линейной математической модели уравнение линейной регрессии имеет вид:

где а и b - параметры линейной регрессии;

а - это коэффициент регрессии, показывающий, насколько в среднем величина одного признака Y изменяется при изменении на единицу меры другого признака X, корреляционно связанного с Y. Чем больше a - угловой коэффициент прямой а= tg α, тем круче прямая, то есть быстрее изменяется Y.

b - свободный член в уравнении, определяет ; при x = 0.

- это предсказанное (должное) значение Y для данного х при определенных значениях регрессионных параметров.

Параметры линейной регрессии определяют методом наименьших квадратов - это способ подбора параметров регрессионной модели, согласно которому сумма квадратов отклонений вариант от линии регрессии должна быть минимальна:

Это эффективный метод, позволяющий уменьшить влияние ошибок измерений.

Теперь определяют должные величины , наносят эти точки и соединяют их прямой линией.

Достоинство корреляционно-регрессионного анализа - наглядное представление о форме и тесноте связи. Регрессия выражает корреляционную зависимость в виде функционального отношения и дает более полную информацию.

Была исследована зависимость между ростом (X) и массой (Y), у 200 животных и рост, и масса подчиняются нормальному закону распределения. На рис. 3а видно, что эта зависимость линейная: чем больше рост, тем больше масса.

Из этой совокупности выберем выборку объема п = 10 (рис. 13.4б). Сохранилась ли эта зависимость массы от роста? На рис. 13.4б изображены 4 прямые, аппроксимирующие эту зависимость. Какую прямую можно считать наилучшей?

Рис 14.4. Зависимость между ростом (X) и массой (Y) у животных

Ответ: Да, сохранилась. Прямая I - не годится - все точки оказались по одну сторону от нее. Прямая II – слишком круто устремляется вверх.

Лучше прямые IIIи IV, а из них лучше та, которая ближе ко всем точкам выборки, то есть относительно которой разброс точек минимален.

Согласно методу наименьших квадратов лучше представляет зависимость от х прямая IV.

По данным примера № 2:

X_i
Y_i	7,8	8,3	7,6	9,1	9,6	9,8	11,8	12,1	14,7	13,0

Рассчитать параметры уравнения регрессии по формулам:

Решение:

Именно это уравнение задает прямую IV в задаче № 6.

В примере № 2 был рассчитан коэффициент корреляции между ростом (X) и массой (Y) некоторых животных, ав примере № 7 было составлено уравнение линейной регрессии.

Как вы думаете, если поменять х и у, то изменится ли уравнение регрессии и коэффициент корреляции?

Ответ: r - останется прежним, r = 0,925 - он симметричен, а уравнение регрессии получится другим. Получается, что связь роста с массой одна, а роста с массой - другая. Регрессионный анализ асимметричен - это мешает его использовать для характеристики силы связи.

Провести корреляционно-регрессионный анализ. Построить корреляционное поле точек, проверить значимость (α ≤ 0,05) коэффициента корреляции между переменными X и Y и построить линию регрессии.

Изучали зависимость между содержанием вещества X в ткани С и приростом концентрации вещества Y в крови у пациентов, получавших препарат А.

Результаты наблюдений приведены в виде двумерной выборки объема 10:

x_i	1,15	1,9		5,34	5,4	7,7	7,9	9,03	9,37	10,18
y_i	0,99	0,98	2,6	5,92	4,33	7,68	9,8	9,47	10,64	12,9

Результаты расчета на компьютере:

r = 0,94; t_набл = 6,17; = 0,579 + 1,1354 ∙ х

Решение:

Н₀: r_ген= 0; Н₁: r_ген≠ 0.

Найдем из таблицы t_крит = 2,31; α ≤ 0,05;

f = 10 - 2 = 8.

Сравним: t_набл > t_крит(α, f); 6,17 > 2,31.

Отвергается H₀ принимается H₁.

Имеется очень сильная линейная корреляционная связь между признаками r = 0,94 (α ≥ 0,05).

Построим корреляционное поле точек (рис. 13.5).

Рис.13.5. График решения задачи 9

Рассчитаем должные величины:

при x = 0, = -0,576;

при х = 1, = 0,556.

Нанесем линию регрессии на график.

Развернуть

Открыть в широком формате

– Конец работы –

Эта тема принадлежит разделу:

Кафедра математики и информатики. Практикум

Государственное образовательное учреждение... высшего профессионального образования... Рязанский государственный медицинский университет...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Выборочное уравнение линейной регрессии. Метод наименьших квадратов

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Определение предела
Пусть функция f(x) определена в

Замечательные пределы
Найдем предел отношения двух многочленов, т.е. , где P(x)

Понятие производной
Рассмотрим функцию y=f(x). Предположим, что x0 внутренняя точка множества

Геометрический и физический смысл производной
Пусть функция y=f(x) имеет производную в точке x0. Тогда существует касате

Основные правила дифференцирования
Пусть u и v – функции, дифференцируемые в точке х. Тогда 1. Производная суммы двух дифференц

Производные высших порядков
Производная f ′ (x) от функции f(x) называется также производной пер

Дифференциал функции
Если функция f(х) дифференцируема в точке х0, то ее приращение можно представить в виде

Геометрический смысл и свойства дифференциала
Пусть кривая, изображенная на рис. 2.3 является графиком функции y=

Дифференциалы высших порядков
Пусть функция y=f(x) дифференцируема на интервале (a; b). Тог

Промежутки монотонности и знакопостоянства
Если функция f(x) имеет производную на отрезке [a, b] и возрастает на этом отрезке, то ее производная

Экстремумы функции
Функция f(x) имеет в точке х1 максимум, если ее значение в этой точке больше значений во всех точк

Выпуклость и вогнутость функции. Точка перегиба
Опр. Кривая называется выпуклой на интервале (а, b), если все ее точки лежат ниже любой ее касательной на этом интервале. Кри

Асимптоты
При исследовании функций часто бывает, что при удалении координаты х точки кривой в бесконечность кривая неограниченно приближается к некоторой прямой. Прямая назыв

Определение функции нескольких переменных
При рассмотрении функций нескольких переменных ограничимся подробным описанием функций двух переменных, т.к. все полученные результаты будут справедливы для функций произвольного чи

Частные производные
Пусть в некоторой области задана функция z = f(x, y). Возьмем произвольную точку М(х

Полный дифференциал
Для функции f(x, y) выражение Dz = f(x + Dx, y

Формулы для вычисления первой производной
Численное дифференцирование весьма чувствительно к погрешностям, вызванным неточностью исходных данных. Значительно меньшую погрешность имеет дифференцирование многочленов наилучшег

Формулы второй производной
По четырем точкам: ; (первое значение)

Постановка задачи
Пусть некоторая функция f(x) задана таблично на интервале [a,b] f(xn)=yn, f(x1)=y

Интерполяционные формулы конечных разностей
Для функции f(x), заданной таблично, величина Di=yi+1-yi называется первой нисходя

Интерполяционные формулы центральных разностей
Для функции y=f(x) заданной в равноотстоящих узлах центральные разности определяются соотношением

Интерполирование функции с не равноотстоящими узлами
Для произвольно заданных узлов интерполяции можно воспользоваться формулой Лагранжа или многочленом Ньютона. Интерполяционный полином Лагранжа имеет формулу

Первообразная функция и неопределенный интеграл
Пусть функция f(x) определена на некотором (конечном или бесконечном) интервале (а; b). Функция F(x

Основные свойства неопределенного интеграла
Приведем основные свойства неопределенного интеграла или правила интегрирования. Предполагается, что все рассматриваемые неопределенные интегралы существуют. 1. Неопределенный интеграл от

Основные методы интегрирования
7.4.1. Непосредственное интегрирование Способ непосредственного интегрирования основан на использовании свойств неопределенного интеграла и приведении подынтегрального выражения к таблично

Свойства определенного интеграла
1. Определенный интеграл не зависит от обозначения переменной интегрирования, т.е. 2.

Основные методы интегрирования
8.2.1. Формула Ньютона-Лейбница Для вычисления определенного интеграла от непрерывной на отрезке [a;b]функции f(x)

Формула прямоугольников
Если известны значения функции f(x) в некоторых точках x0, x1, … , x

Формула трапеций
Эта формула является более точной по сравнению с формулой прямоугольников. Подынтегральн

Метод средних
Пусть для определенности a = x0, b = xn. Обозначим через

Формула Симпсона
(формула парабол или квадратурная формула) Разделим отрезок интегрирования [a, b] на четное число отрезков п

Основные определения
Дифференциальным уравнением называется уравнение, связывающее независимую переменную х, искомую функцию y=f(x), и ее производные

Однородные уравнения первого порядка
Функция f(x, y) называется однородной функцией степени n, где n – целое число, если при любом

Линейные уравнения первого порядка
Дифференциальное уравнение 1-го порядка называется линейным, если оно содержит искомую функцию y и ее производную

Однородные уравнения первого порядка
№4. Найти общее решение уравнения (х+у)dx–xdy=0. Решение. Данное уравнение является однородным уравнением первой степени относител

I. Метод Лагранжа
Найдем сначала общее решение соответствующего ЛОДУ , т.е.

II. Метод Бернулли
Пусть. Тогда

Метод вариации произвольной постоянной
Найдем сначала общее решение соответствующего ЛОДУ Разделяя переменные и интегрируя, получим ln|

Метод подстановки
Полагаем , где u=u(y), v=v(y)

Однородные уравнения первого порядка
№10.3. Найдите общие решения уравнений: а) ; б)

Линейные уравнения первого порядка
№10.5. Решить дифференциальные уравнения: а) ; б)

Применение дифференциальных уравнений в биологии и медицине.
Задача 1. Закон размножения бактерий с течением времени. Скорость размножения некоторых бактерий пропорциональна количеству бактерий в данный момент. Найти зависимость изменения кол

Метод Эйлера
Известно, что уравнение задает в некоторой области поле направлений. Решение этого уравн

Случайное событие
Теория вероятностей – математическая наука, изучающая закономерности случайных явлений. Теория вероятности изучает случайные события и случайные величины. С

Комбинаторика
Комбинаторика — раздел математики, изучающий вопросы о том, сколько комбинаций определенного типа можно составить из данных предметов (элементов). Как при решении задач с использова

Вероятность случайного события
Численная мера степени объективности возможности наступления события называется вероятностью случайного события. Классическое определение вероятности события

Закон сложения вероятностей
Сумма двух событий – это такое событие, при котором появляется хотя бы одно из этих событий (А или В). Если А и В совместные события, то их сумм

Условная вероятность, закон умножения вероятностей
Условная вероятность события В – это вероятность события В, найденная при условии, что событие А произошло. Обозначается Р(В|А).

Формулы полной вероятности и Байеса
Вероятность события A, которое может наступить лишь при условии появления одного из n попарно несовместимых событий B1, B2, ..., Bn

Формулы Бернулли, Пуассона и Муавра-Лапласа
Если производятся испытания, при которых вероятность появления события А в каждом испытании не зависит от исходов других испытаний, то такие испытания называются незав

Случайные величины
Случайная величина - это величина, которая в результате испытания в зависимости от случая принимает одно из возможного множества своих значений (какое именно - заранее неизвестно).

Закон распределения случайной величины
Это всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями. Для дискретной случайной величины закон распределения може

Функция распределения случайных величин
Функция F(x), выражающая для каждого х вероятность того, что случайная величина X примет значение меньше некоторого фиксированного х, называется функцией распределения случайной величины X:

Числовые характеристики дискретной случайной величины
1. Математическим ожиданием М(Х) дискретной случайной величины называется сумма произведений всех ее значений на соответствующие им вероятности:

Плотность вероятности непрерывных случайных величин
Плотностью вероятности, или плотностью распределения f(x) непрерывной случайной величины Х, называется производная её функции распределения: f(x) = F' (x). Ее также называют диффе

Нормальный закон распределения
Этот закон наиболее часто встречается на практике. Он является предельным законом, к которому приближаются другие законы распределения. Нормальное распределение является одним из самых важных распр

Характеристики положения
Мода () – это такое значение варианты, что предшествующее и следующее за ним знач

Оценка параметров генеральной совокупности по ее выборке
Смысл статистических методов заключается в том, чтобы по выборке ограниченного объема n, то есть по некоторой части генеральной совокупности, высказать обоснованное суждение о ее свойствах в целом.

Точечная оценка параметров генеральной совокупности
Точечная оценка – это оценка, которая определяется одним числом. И это число определяется по выборке. Это функция результатов выборки, и она является точечной оценкой генерального параметра, т. е.

Интервальная оценка параметров генеральной совокупности
Точечные оценки параметров распределения не дают информации о степени близости к соответствующему теоретическому параметру. Поэтому построение интервала, в котором с заданной степенью достоверности

Функциональная и корреляционная зависимости
Функциональная зависимость - это зависимость вида у =f(x), когда каждому возможному значению случайной величины X соответствует одно возможное значение случайной величины Y.

Коэффициент линейной корреляции и его свойства
На практике исследователя часто может интересовать не сама зависимость одной переменной от другой, а именно характеристика тесноты связи между ними, которую можно было бы выразить одним числом. Эта

Свойства коэффициента корреляции r.
Они проявляются при достаточно большом объеме выборки п. 1. Коэффициент корреляции принимает значения на отрезке -1 ≤ r ≤ 1. В зависимости от того, насколько |r|

Проверка гипотезы о значимости выборочного коэффициента линейной корреляции
Это ответ на вопрос: существует ли вообще эта связь. Эмпирический коэффициент корреляции, как и любой другой выборочный показатель, служит оценкой своего ге

Нелинейная регрессия
Если график регрессии = f(x) изображается кривой линией (рис. 6), то это нелинейная регрес

T-распределение (распределение Стьюдента)
P (t > ta) = a и P (|t| > ta) = a Таблица 1 k Односторонняя критическая область (a)

Истинной и эмпирической функции распределения
Таблица 4 n Уровень значимости 0,05 Уровень значимости 0,01 точная граница асимптотическ

Библиографический список
1. Баврин И.И. Высшая математика: учеб. для студ. высш. учеб. заведений /И.И. Баврин, В.Л. Матросов. – М.: Владос, 2002. –400с. 2. Берман Г.Н. Сборник задач по курсу матема