рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

XI. Метод корреляции

XI. Метод корреляции - раздел Математика, По медицинской статистике   При Проведении Исследования В Биологии Или Медицине, Как Прав...

 

При проведении исследования в биологии или медицине, как правило, регистрируются множество учетных признаков. Представляет интерес вопрос об их взаимном изменении, т.е. обнаружение зависимостей между ними. Выявление наличия таких взаимосвязей является одной из важнейших задач любой науки, в том числе и медицины.

Различают две формы количественных связей между явлениями или процессами: функциональную и корреляционную. Под ФУНКЦИОНАЛЬНОЙ понимают такую связь, при которой любому значению одного из признаков соответствует строго определенное значение другого. В точных науках, таких, как физика, химия и другие, может быть установлена функциональная взаимосвязь. Например, зависимость площади круга от длины окружности в геометрии, или в физике длина пути, пройденной телом в свободном падении, от времени. Наиболее известным видом функциональной зависимости является линейная, которая выражается математической формулой: y = ax+b.

В биологии и медицине установить функциональную зависимость, как правило, не удается. Объекты этих исследований имеют большую изменчивость и зависят от огромного числа факторов, измерить которые просто невозможно. В этом случае определяется наличие КОРРЕЛЯЦИОННОЙ связи, при которой значению каждой средней величины одного признака соответствует несколько значений другого взаимосвязанного с ним признака. Например: связь между ростом и массой тела человека. У группы людей с одинаковым ростом наблюдается различная масса тела, однако она варьирует в определенных пределах вокруг средней величины. Поэтому такую зависимость нужно оценивать с использованием понятия случайной величины с привлечением подходов теории вероятности. Такую форму зависимостей называют «Корреляционной».

 

При поиске зависимости между признаками может быть обнаружена взаимосвязь, различная по направлению и силе:

- Прямая (при увеличении одного признака увеличивается второй);

- Обратная (при увеличении одного признака второй уменьшается).

 

Степень взаимосвязи признаков по силе (тесноте) принято обозначать как:

- Отсутствие;

- Слабая;

- Средняя;

- Сильная;

- Полная.

 

Способами выявления корреляционной взаимосвязи между признаками являются:

- Визуальные (таблицы и графики).

- Статистические (корреляция и регрессия).

 

Следует подчеркнуть, что обнаружение корреляции между двумя признаками еще не говорит о существовании причинной связи между ними, а лишь указывает на возможность таковой или на наличие фактора, определяющего изменение обеих переменных совместно.

Приёмы визуализации данных позволяют обнаружить корреляционную зависимость лишь при небольшом числе наблюдений и только приблизительно. Для обнаружения корреляционной взаимосвязи с помощью таблицы в ней располагают ранжированные вариационные ряды и затем определяют совместное изменение признаков. График более наглядно демонстрирует такую зависимость и позволяет оценить ее форму: линейная, параболическая, тригонометрическая и др.

Наиболее точным способом обнаружения взаимосвязи между признаками является вычисление коэффициента корреляции. В зависимости от природы обрабатываемых данных применяются параметрические или непараметрические методы вычисления этого коэффициента.

При вычислении коэффициента корреляции исследователь получает возможность судить о силе связи (степени сопряженности) и ее направлении, а также с требуемой долей вероятности делать вывод о проявлении этой связи в генеральной совокупности. Чем больше коэффициент корреляции, тем с большей степенью уверенности можно говорить о наличии корреляционной зависимости между признаками. Если каждому заданному значению одного признака соответствуют близкие друг к другу, тесно расположенные около средней величины значения другого признака, то связь является более тесной. Когда эти значения сильно варьируют, связь менее тесная. Таким образом, мера корреляции указывает, насколько тесно связаны между собой параметры.

Коэффициент корреляции может принимать значения от -1 до +1. Направление обнаруженной взаимосвязи определяют по знаку коэффициента корреляции. При его положительном значении обнаруженная связь является прямой, при отрицательном – обратной. Сила связи оценивается по модулю этого коэффициента. Условно выделяют следующие уровни корреляционной связи: отсутствие – 0; слабая – от 0 до 0,3; средняя – от 0,3 до 0,7; сильная – 0,7 и более; полная – 1. Однако обсуждать наличие корреляции имеет смысл только в тех случаях, когда она статистически значима (p<0,05). Поэтому после вычисления коэффициента корреляции производится определение его ошибки репрезентативности и критерия достоверности.

Наиболее часто применяемыми в настоящее время методами обнаружения корреляции являются параметрический анализ по Пирсону и непараметрический анализ по Спирмену. Этими методами проверяется нулевая гипотеза (H0) об отсутствии связи между параметрами. Если такая гипотеза отклоняется при заданном уровне значимости (p), можно говорить о наличии взаимосвязи между параметрами.

 

Корреляционный анализ по Пирсону используется при решении задачи исследования линейной связи двух нормально распределенных параметров. Кроме проверки на нормальность распределения каждого параметра, до проведения корреляционного анализа рекомендуется строить график в координатах оцениваемых параметров, чтобы визуально определить характер зависимости.

Коэффициент корреляции Пирсона (rxy) или коэффициент линейной корреляции, был разработан в 90-х годах XIX века Карлом Пирсон, Фрэнсисом Эджуортом и Рафаэлем Уэлдоном в Англии. Он рассчитывается по формуле:

 

 

 

где: rxy – коэффициент линейной корреляции Пирсона;

covXY – ковариация признаков X и Y;

σX – среднее квадратическое отклонение признака X;

σY – среднее квадратическое отклонение признака Y;

– средняя арифметическая признака X;

– средняя арифметическая признака Y.

 

В медицинской литературе встречается упрощенная запись этой формулы:

 

 

где: rxy – коэффициент линейной корреляции Пирсона;

dx – отклонение каждой варианты признака x от средней этого признака: dx = x - Mx,

dy – отклонение каждой варианты признака y от средней этого признака: dy = y - My.

 

В программе Excel значение коэффициент линейной корреляции Пирсона может быть вычислено функцией = КОРРЕЛ(Диапазон ячеек 1-го ряда; Диапазон ячеек 2-го ряда).

Для прогнозирования уровня корреляции в генеральной совокупности определяют ошибку репрезентативности этого коэффициента mr. Она вычисляется по формуле:

,

где: mr – ошибка репрезентативности коэффициента корреляции;

rxy – коэффициент линейной корреляции Пирсона;

n – число парных вариант.

 

Достоверность коэффициента линейной корреляции оценивается по коэффициенту Стьюдента (tr), который вычисляется с использованием его ошибки:

,

где: tr – коэффициент достоверности Стьюдента;

rxy – коэффициент линейной корреляции Пирсона;

mr – ошибка репрезентативности коэффициента корреляции.

 

Если число парных вариант n>30, то при tr >2 связь считается достоверной при уровне значимости p<0,05. Если число парных вариант n<30, то критическое значение tr-Крит. находят по таблице критических значений Стьюдента при степени свободы df = n - 2. В программе Excel это значение вычисляется функцией = СТЬЮДРАСПОБР(Уровень значимости p; Степени свободы df).

С целью уменьшения объема вычислений может применяться функция =КОРРЕЛ(Диапазон1; Диапазон2) или надстройка «Анализ данных» и ее модуль «Корреляционный анализ».

 

Отсутствие линейной корреляции еще не означает, что параметры полностью независимы. Связь между ними может быть нелинейной, или признаки, используемые в вычислениях, могут не подчиняться нормальному закону распределения. Поэтому, помимо вычисления коэффициента линейной корреляции, прибегают к использованию непараметрических коэффициентов корреляции. К ним относятся:

- Коэффициент ранговой корреляции Спирмена;

- Коэффициент ранговой корреляции Кендалла;

- Коэффициент корреляции знаков Фехнера;

- Коэффициент множественной ранговой корреляции (конкордации).

 

Корреляционный анализ по Спирмену применяется для обнаружения взаимосвязи двух параметров, если распределение хотя бы одного из них отлично от нормального.

Каждому показателю x и y присваивается ранг. На основе полученных рангов рассчитываются их разности d. Затем вычисляется коэффициент корреляции (ρ) по формуле:

 

где: r – коэффициент корреляции Спирмена;

d – разность рангов;

n – число парных вариант.

 

Ошибка репрезентативности коэффициента корреляции Спирмена определяется по формуле:

,

а коэффициент достоверности Стьюдента:

,

где: tr – коэффициент достоверности Стьюдента;

r – коэффициент корреляции Спирмена;

mr – ошибка репрезентативности коэффициента корреляции Спирмена.

 

Оценка коэффициента корреляции Спирмена и его достоверности выполняется так же, как и коэффициента линейной корреляции Пирсона.

– Конец работы –

Эта тема принадлежит разделу:

По медицинской статистике

В И Сабанов... Н В Эккерт...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: XI. Метод корреляции

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Профессора В.З. Кучеренко
  Волгоград 2013   МИНИСТЕРСТВО ЗДРАВООХРАНЕНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ   Первый московский государственный медицинский

I. Базовые принципы применения программы Excel
  Широкое распространение компьютерной техники, а также достижения информатики позволяют использовать персональные компьютеры, оснащенные прикладным программным обеспечением с целью п

Заполнение табличного документа протокола работы студента.
а) В общей папке учебной группы откройте табличный документ с именем «Статистика–Фамилии студентов». Измените название «Лист1» на «Титул».   б) Создайте новый лист и у

О теории вероятностей
Теория вероятностей — это математическая наука, изучающая закономерности массовых случайных явлений (событий). Даже само высказывание "вычислить вероятность" содержит пара

Определение вероятности
Вероятностью P(A) события называется отношение числа m исходов опыта, благоприятствующих событию A, к общему числу n

Действия над событиями
Сложение вероятности событий: Сложением (или объединением) двух событий A и В называется событие С, заключающееся в том, что произойдет по крайней мере одно из

Элементы комбинаторики
Выбор способа нахождения числа возможных перестановок и комбинаций k элементов из их общего числа n выполняется с учетом комбинаторных конфигураций. Основными комбинаторными конфигурациями являются

Формула Байеса
Теорема Байеса (или формула Байеса) – это одна из основных теорем теории вероятностей, которая позволяет определить вероятность того, что произошло какое-либо событие (гипотеза) при наличии

III. Организация и этапы статистического исследования
В любом медико-биологическом и социально-гигиеническом исследовании ведущая роль отводится проведению статистического наблюдени

IV. Статистические таблицы
Каждое медико-биологическое или социально-гигиеническое исследование начинается с этапа планирования эксперимента. На этом этапе необходимо разработать макеты ста

V. Относительные величины, динамические ряды
Для характеристики изучаемой статистической совокупности используются относительные величины, расчет которых проводится на третьем этапе статистического исследования. Относительные величин

VI. Вариационные ряды, средние величины, вариабельность признака
Особое место в статистическом анализе принадлежит определению среднего уровня изучаемого признака или явления. Средний уровень признака измеряют средними величинами. Средняя величина харак

Вывод: средняя частота пульса пациентов изучаемой группы составляет 121,9 ударов в минуту, вариабельность пульса малая.
б) Преобразование не ранжированного вариационного ряда в ранжированный (таблица 14) производится в имеющей таблице простого ряда с помощью команды сортировки по столбцу V

Вывод: Средняя частота пульса пациентов 2-го отделения с вероятностью 95,5% составляет 126,2±2,04 ударов в минуту, вариабельность малая.
  б) Создание сгруппированного вариационного ряда (таблица 18) и построение графика распределения (рис. 11). Таблица 18 Сгруппированный, ранжированный

VII. Проверка статистических гипотез, критерий Стьюдента
В научно-исследовательской практике часто требуется сопоставить средние арифметические, например, при сравнении результатов в контрольной и экспериментальной группах, при оценке показателей здоровь

VIII. Проверка статистических гипотез, критерий Хи-квадрат
  Анализ характера распределения данных (его еще называют проверкой на нормальность распределения) осуществляется по каждому параметру. Если установлено, что признак не является норма

IX. Метод стандартизации
  Основным принципом подбора групп статистического наблюдения в случае необходимости сравнения между ними является однородность сравниваемых совокупностей по характеризующим признакам

X. Дисперсионный анализ
Трудно представить любое медицинское исследование (социально-гигиеническое, гигиеническое, клиническое, экспериментальное и др.), в котором не ставилась бы в той или иной мере задача определения си

Вывод: зависимость изменения двух изучаемых параметров является сильной прямой и статистически достоверной при уровне значимости p<0,05.
    г) вычисление и оценка коэффициента корреляции методом Спирмена. В таблице вариационных рядов производится подсчет рангов как показано в таблице 34. Каждому

XII. Метод регрессии
Метод регрессии - это статистический способ поиска функции, которая позволяет по величине одного коррелируемого признака судить о величине другого. С помощью регрессии ставится задача выясни

Патологоанатомических вскрытий
Заболевания Число патологоанатомических вскрытий Инфаркт миокарда Язвенная болезнь желудка

Патологоанатомических вскрытий
Заболевания Число несовпадений диагнозов Пол Всего М Ж Инфаркт миокарда

Патологоанатомических вскрытий
Заболевания Возраст Всего 0-16 лет 17-60 лет 61 и более М Ж

СОВПАДЕНИЕ ДИАГНОЗОВ ЛПУ С ДАННЫМИ ПАТОЛОГОАНАТОМИЧЕСКИХ ВСКРЫТИЙ
Причины смерти по данным ЛПУ Число пат. анатомических вскрытий Число несовпадений диагнозов Инфаркт миокарда

УТОЧНЕНИЕ ПРИЧИН СМЕРТИ ПО ДАННЫМ ПАТОЛОГОАНАТОМИЧЕСКИХ ВСКРЫТИЙ
Причины смерти по данным ЛПУ Число пат.анат. вскрытий Число несовпадений диагнозов Инфаркт миокарда

Критические значения критерия Шапиро-Уилкса
    Число наблюдений, n Критическое значение критерия W для уровня вероятности p p=0,01 p=0,05

Критические значения критерия F-Фишера при p=0,05
df2 Степени свободы df1

Список сокращений
  ANOVA – дисперсионный анализ (от англ. ANalysis Of VAriance); covxy – ковариация признаков x и y

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги