Выборочное уравнение линейной регрессии. Метод наименьших квадратов
Выборочное уравнение линейной регрессии. Метод наименьших квадратов - раздел Информатика, Кафедра математики и информатики. Практикум При Проведении Современных Клинических Исследований Обычно Нет Недостатка В И...
При проведении современных клинических исследований обычно нет недостатка в информации: каждому пациенту соответствует целое множество различных клинических показателей и данных.
В них могут быть завуалированы некоторые соотношения, основные черты которых и позволяют выявлять методы регрессионного анализа.
При этом задача регрессионного анализа состоит в подборе упрощенной аппроксимации этой связи с помощью математической модели.
Регрессионный анализ имеет в своем распоряжении специальные процедуры проверки, является ли выбранная математическая модель адекватной для описания имеющихся данных.
Чаще всего регрессионный анализ используется для прогноза, то есть предсказания значений ряда зависимых переменных по известным значениям других переменных.
Выше указывалось, что результаты наблюдений, приведенные в двумерной выборке:
xi
x1
x2
x3
x4
x5
yi
y1
y2
y3
y4
y5
можно представить в виде корреляционного поля точек (рис. 14.3), где каждая точка соответствует отдельным значениям х и у.
Рис. 14.3. Метод наименьших квадратов
В результате получается диаграмма рассеяния, позволяющая судить о форме и тесноте связи между варьирующими признаками. Довольно часто эта связь может быть аппроксимирована прямой линией (рис. 14.3).
Регрессия - это функция, позволяющая по величине одного признака X находить среднее ожидаемое (должное) значение другого признака Y, корреляционно связанного с X.
В линейной математической модели уравнение линейной регрессии имеет вид:
,
где а и b - параметры линейной регрессии;
а - это коэффициент регрессии, показывающий, насколько в среднем величина одного признака Y изменяется при изменении на единицу меры другого признака X, корреляционно связанного с Y. Чем больше a - угловой коэффициент прямой а= tg α, тем круче прямая, то есть быстрее изменяется Y.
b - свободный член в уравнении, определяет ; при x = 0.
- это предсказанное (должное) значение Y для данного х при определенных значениях регрессионных параметров.
Параметры линейной регрессии определяют методом наименьших квадратов - это способ подбора параметров регрессионной модели, согласно которому сумма квадратов отклонений вариант от линии регрессии должна быть минимальна:
Это эффективный метод, позволяющий уменьшить влияние ошибок измерений.
Теперь определяют должные величины , наносят эти точки и соединяют их прямой линией.
Достоинство корреляционно-регрессионного анализа - наглядное представление о форме и тесноте связи. Регрессия выражает корреляционную зависимость в виде функционального отношения и дает более полную информацию.
Была исследована зависимость между ростом (X) и массой (Y), у 200 животных и рост, и масса подчиняются нормальному закону распределения. На рис. 3а видно, что эта зависимость линейная: чем больше рост, тем больше масса.
Из этой совокупности выберем выборку объема п = 10 (рис. 13.4б). Сохранилась ли эта зависимость массы от роста? На рис. 13.4б изображены 4 прямые, аппроксимирующие эту зависимость. Какую прямую можно считать наилучшей?
Рис 14.4. Зависимость между ростом (X) и массой (Y) у животных
Ответ: Да, сохранилась. Прямая I - не годится - все точки оказались по одну сторону от нее. Прямая II – слишком круто устремляется вверх.
Лучше прямые IIIи IV, а из них лучше та, которая ближе ко всем точкам выборки, то есть относительно которой разброс точек минимален.
Согласно методу наименьших квадратов лучше представляет зависимость от х прямая IV.
По данным примера № 2:
Xi
Yi
7,8
8,3
7,6
9,1
9,6
9,8
11,8
12,1
14,7
13,0
Рассчитать параметры уравнения регрессии по формулам:
Решение:
Именно это уравнение задает прямую IV в задаче № 6.
В примере № 2 был рассчитан коэффициент корреляции между ростом (X) и массой (Y) некоторых животных, ав примере № 7 было составлено уравнение линейной регрессии.
Как вы думаете, если поменять х и у, то изменится ли уравнение регрессии и коэффициент корреляции?
Ответ: r - останется прежним, r = 0,925 - он симметричен, а уравнение регрессии получится другим. Получается, что связь роста с массой одна, а роста с массой - другая. Регрессионный анализ асимметричен - это мешает его использовать для характеристики силы связи.
Провести корреляционно-регрессионный анализ. Построить корреляционное поле точек, проверить значимость (α ≤ 0,05) коэффициента корреляции между переменными X и Y и построить линию регрессии.
Изучали зависимость между содержанием вещества X в ткани С и приростом концентрации вещества Y в крови у пациентов, получавших препарат А.
Результаты наблюдений приведены в виде двумерной выборки объема 10:
xi
1,15
1,9
5,34
5,4
7,7
7,9
9,03
9,37
10,18
yi
0,99
0,98
2,6
5,92
4,33
7,68
9,8
9,47
10,64
12,9
Результаты расчета на компьютере:
r = 0,94; tнабл= 6,17; = 0,579 + 1,1354 ∙ х
Решение:
Н0: rген = 0; Н1: rген ≠ 0.
Найдем из таблицы tкрит= 2,31; α ≤ 0,05;
f = 10 - 2 = 8.
Сравним: tнабл > tкрит(α, f); 6,17 > 2,31.
Отвергается H0принимается H1.
Имеется очень сильная линейная корреляционная связь между признаками r = 0,94 (α ≥ 0,05).
Асимптоты
При исследовании функций часто бывает, что при удалении координаты х точки кривой в бесконечность кривая неограниченно приближается к некоторой прямой.
Прямая назыв
Определение функции нескольких переменных
При рассмотрении функций нескольких переменных ограничимся подробным описанием функций двух переменных, т.к. все полученные результаты будут справедливы для функций произвольного чи
Частные производные
Пусть в некоторой области задана функция z = f(x, y). Возьмем произвольную точку М(х
Формулы для вычисления первой производной
Численное дифференцирование весьма чувствительно к погрешностям, вызванным неточностью исходных данных. Значительно меньшую погрешность имеет дифференцирование многочленов наилучшег
Интерполирование функции с не равноотстоящими узлами
Для произвольно заданных узлов интерполяции можно воспользоваться формулой Лагранжа или многочленом Ньютона. Интерполяционный полином Лагранжа имеет формулу
Основные свойства неопределенного интеграла
Приведем основные свойства неопределенного интеграла или правила интегрирования. Предполагается, что все рассматриваемые неопределенные интегралы существуют.
1. Неопределенный интеграл от
Основные методы интегрирования
7.4.1. Непосредственное интегрирование
Способ непосредственного интегрирования основан на использовании свойств неопределенного интеграла и приведении подынтегрального выражения к таблично
Линейные уравнения первого порядка
Дифференциальное уравнение 1-го порядка называется линейным, если оно содержит искомую функцию y и ее производную
Однородные уравнения первого порядка
№4. Найти общее решение уравнения (х+у)dx–xdy=0.
Решение. Данное уравнение является однородным уравнением первой степени относител
I. Метод Лагранжа
Найдем сначала общее решение соответствующего ЛОДУ , т.е.
Применение дифференциальных уравнений в биологии и медицине.
Задача 1. Закон размножения бактерий с течением времени.
Скорость размножения некоторых бактерий пропорциональна количеству бактерий в данный момент. Найти зависимость изменения кол
Метод Эйлера
Известно, что уравнение задает в некоторой области поле направлений. Решение этого уравн
Случайное событие
Теория вероятностей – математическая наука, изучающая закономерности случайных явлений.
Теория вероятности изучает случайные события и случайные величины.
С
Комбинаторика
Комбинаторика — раздел математики, изучающий вопросы о том, сколько комбинаций определенного типа можно составить из данных предметов (элементов). Как при решении задач с использова
Вероятность случайного события
Численная мера степени объективности возможности наступления события называется вероятностью случайного события.
Классическое определение вероятности события
Закон сложения вероятностей
Сумма двух событий – это такое событие, при котором появляется хотя бы одно из этих событий (А или В).
Если А и В совместные события, то их сумм
Формулы полной вероятности и Байеса
Вероятность события A, которое может наступить лишь при условии появления одного из n попарно несовместимых событий B1, B2, ..., Bn
Формулы Бернулли, Пуассона и Муавра-Лапласа
Если производятся испытания, при которых вероятность появления события А в каждом испытании не зависит от исходов других испытаний, то такие испытания называются незав
Случайные величины
Случайная величина - это величина, которая в результате испытания в зависимости от случая принимает одно из возможного множества своих значений (какое именно - заранее неизвестно).
Закон распределения случайной величины
Это всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями.
Для дискретной случайной величины закон распределения може
Функция распределения случайных величин
Функция F(x), выражающая для каждого х вероятность того, что случайная величина X примет значение меньше некоторого фиксированного х, называется функцией распределения случайной величины X:
Плотность вероятности непрерывных случайных величин
Плотностью вероятности, или плотностью распределения f(x) непрерывной случайной величины Х, называется производная её функции распределения:
f(x) = F' (x).
Ее также называют диффе
Нормальный закон распределения
Этот закон наиболее часто встречается на практике. Он является предельным законом, к которому приближаются другие законы распределения. Нормальное распределение является одним из самых важных распр
Характеристики положения
Мода () – это такое значение варианты, что предшествующее и следующее за ним знач
Оценка параметров генеральной совокупности по ее выборке
Смысл статистических методов заключается в том, чтобы по выборке ограниченного объема n, то есть по некоторой части генеральной совокупности, высказать обоснованное суждение о ее свойствах в целом.
Точечная оценка параметров генеральной совокупности
Точечная оценка – это оценка, которая определяется одним числом. И это число определяется по выборке. Это функция результатов выборки, и она является точечной оценкой генерального параметра, т. е.
Интервальная оценка параметров генеральной совокупности
Точечные оценки параметров распределения не дают информации о степени близости к соответствующему теоретическому параметру. Поэтому построение интервала, в котором с заданной степенью достоверности
Функциональная и корреляционная зависимости
Функциональная зависимость - это зависимость вида у =f(x), когда каждому возможному значению случайной величины X соответствует одно возможное значение случайной величины Y.
Коэффициент линейной корреляции и его свойства
На практике исследователя часто может интересовать не сама зависимость одной переменной от другой, а именно характеристика тесноты связи между ними, которую можно было бы выразить одним числом. Эта
Свойства коэффициента корреляции r.
Они проявляются при достаточно большом объеме выборки п.
1. Коэффициент корреляции принимает значения на отрезке -1 ≤ r ≤ 1. В зависимости от того, насколько |r|
Библиографический список
1. Баврин И.И. Высшая математика: учеб. для студ. высш. учеб. заведений /И.И. Баврин, В.Л. Матросов. – М.: Владос, 2002. –400с.
2. Берман Г.Н. Сборник задач по курсу матема
Хотите получать на электронную почту самые свежие новости?
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Новости и инфо для студентов