рефераты конспекты курсовые дипломные лекции шпоры

Раздел Математика
/
X. Дисперсионный анализ

Реферат Курсовая Конспект

Выберите учебное заведение

X. Дисперсионный анализ

X. Дисперсионный анализ - раздел Математика, По медицинской статистике Трудно Представить Любое Медицинское Исследование (Социально-Гигиеническое, Г...

Трудно представить любое медицинское исследование (социально-гигиеническое, гигиеническое, клиническое, экспериментальное и др.), в котором не ставилась бы в той или иной мере задача определения силы влияния различных факторов на размеры изучаемого признака. Определяя различия средних арифметических двух выборочных групп наблюдения путем расчета критерия Стьюдента t, который позволяет выявить статистическую значимость разницы средних, исследователь подразумевает, как само собой разумеющееся, что группы исследуемых совершенно однородны и отличаются только по одному какому-то признаку или методу воздействия на них.

Между тем на практике это условие соблюдается далеко не всегда. На изучаемое явление и, следовательно, его средний уровень оказывают влияние многочисленные факторы, как постоянные (планируемые или сознательно выделяемые для их изучения), так и случайные (неопределенные). Например, больные гипертонической болезнью, отобранные по полу, возрасту, стадии и длительности заболевания, помимо болезни, подвергаются воздействию других неучтенных факторов, в результате чего у разных больных наблюдается различный уровень артериального давления.

При изучении явлений, сравнении их друг с другом в поисках сходства и различий необходимо обращать внимание не только на величину средних, но и на разнообразие вариант, а также вариабельность изучаемых признаков. Исследователь может встретить вариационные ряды, не отличающиеся по центральной тенденции (размеру средней арифметической), но различные по степени варьирования. И наоборот - ряды, одинаковые по величине разброса вариант, могут различаться по размерам средней арифметической. Установление значимости различий средних арифметических, измерение степени влияния факторов и их градаций на варьирующий (результативный) признак наиболее эффективно достигаются путем применения дисперсионного анализа. Впервые основа дисперсионного анализа была разработана известным английским статистиком Р. Фишером в 1925 году.

Дисперсионный анализ – это метод в статистической математике, направленный на поиск зависимостей в экспериментальных данных путём исследования значимости различий вариабельности признака в исследуемой совокупности. В литературе также встречается обозначение ANOVA (от англ. ANalysis Of VAriance). Он базируется на определении степени рассеяния (дисперсии) оцениваемых признаков в нескольких группах. Это позволяет измерить силу влияния отдельных факторов на значения показателей.

Известно, что величина отдельных признаков представляет собой результат воздействия разнообразных факторов, различных по силе влияния. Одни факторы имеют значительно большую силу влияния, другие - меньшую. Причем, как правило, факторы сами воздействуют друг на друга, сочетая свое влияние, иногда усиливают действие друг друга, иногда, наоборот, погашают это действие. Преимуществом дисперсионного анализа является то, что он дает возможность изучить и сравнить роль каждого из них.

В отличие от дисперсионного анализа другие общепринятые в медицинских исследованиях статистические методы обработки, как правило, предусматривают проведение попарных сравнений, что приводит к огромному объему расчетов и часто не дает полной оценки.

Сущность дисперсионного анализа заключается в изучении статистического влияния одного или нескольких факторов на результативный признак.

Фактор - это влияние, воздействие или состояние, которое отражается на размерах и разнообразии результативного признака.

Результативный признак - это элементарное свойство объектов, изучаемое как результат влияния факторов: организованных в исследовании (основных - х) и всех остальных, неорганизованных, не учтенных в данном исследовании (случайных - z).

Градации фактора - это степень его воздействия, в том числе отсутствие воздействия (нулевое значение) в контрольной группе или состояние объектов изучения (пол, возраст и др.).

Дисперсионный комплекс - это совокупность градаций изучаемых данных (групп объектов наблюдения, выбранных исследователем) с вычисленными значениями относительных или средних величин по каждой градации.

При изучении количественных признаков в градации дисперсионного комплекса заносятся числовые результаты измерения изучаемого признака у каждого отдельного объекта. При изучении качественных признаков в градации комплекса заносится число объектов с наличием признака и общее число объектов.

Дисперсионные комплексы, составленные по принципу случайного отбора, называются рандомизированными.

Статистическое влияние - это отражение в разнообразии результативного признака того разнообразия фактора (его градаций), которое организовано в исследовании.

Сумма основных и случайных факторов составит общие факторы (у). Результативный признак изучается как результат воздействия факторов, организованных в исследовании (х) и неорганизованных (z).

Общее влияние как раз и определяет влияние всех организованных и неорганизованных (случайных) факторов, определивших такое развитие признака, которое наблюдалось в дисперсионном комплексе. Общее влияние служит базой для определения доли влияний - факториальных и случайных.

Факториальное влияние - это простое или комбинированное статистическое влияние изучаемых (учтенных) факторов.

Случайное влияние - это действие тех факторов, которые не учтены в дисперсионном комплексе и составляют общий фон, на котором действуют учитываемые факторы.

Таким образом, дисперсионный анализ исследует важнейшее свойство совокупности – разнообразие (вариабельность, дисперсию) признака. Для этого выделяется три вида разнообразия: межгрупповое, внутригрупповое и общее. Межгрупповое разнообразие зависит от влияния исследуемого фактора, по которому выделяется каждая группа. Иными словами, межгрупповое разнообразие - это различие средних в каждой группе. Внутригрупповое разнообразие зависит от силы влияния каких-то неучтенных случайных факторов. Общее разнообразие складывается из межгруппового и внутригруппового.

В основе дисперсионного анализа лежит предположение о том, что одни переменные могут рассматриваться как причины (факторы, независимые переменные): f₁, …, f_k, а другие как следствия (зависимые переменные). Независимые переменные называют иногда регулируемыми факторами именно потому, что в эксперименте исследователь имеет возможность варьировать ими и анализировать получающийся результат.

Основной целью дисперсионного анализа является исследование значимости различия между группами с помощью сравнения дисперсий. Разделение общей дисперсии на несколько источников позволяет сравнить дисперсию, вызванную различием между группами, с дисперсией, вызванной внутригрупповой изменчивостью. При истинности нулевой гипотезы (о равенстве средних в нескольких группах наблюдений, выбранных из генеральной совокупности), оценка дисперсии, связанной с внутригрупповой изменчивостью, должна быть близкой к оценке межгрупповой дисперсии. Если выполняется сравнение средних в двух выборках, дисперсионный анализ даст тот же результат, что и обычный t-критерий Стьюдента. Однако, помимо этого, он позволяет оценить степень такого влияния, а также может использоваться при сопоставлении более чем 2-х групп.

Сущность дисперсионного анализа заключается в расчленении общей дисперсии (D или SS) изучаемого признака на отдельные компоненты, обусловленные влиянием конкретных факторов, и проверке гипотез о значимости влияния этих факторов на исследуемый признак. Обозначение SS - это сокращение от фразы "суммы квадратов" (Англ. sum of squares). Оно чаще всего используется в зарубежных источниках.

Сравнивая компоненты дисперсии друг с другом посредством F-критерия Фишера, можно определить, какая доля общей вариативности результативного признака обусловлена действием регулируемых факторов.

Критерий Фишера экспериментальных (эмпирических) данных (F_Эмп.) вычисляется как отношение среднего квадрата дисперсии, обусловленной изучаемым фактором, к среднему квадрату случайной дисперсии:

где: F_Эмп. – критерий Фишера, вычисленный в исследуемой совокупности,

MS_Факт. – средний квадрат дисперсии, обусловленной изучаемым фактором,

MS_Случ. – средний квадрат дисперсии, обусловленной случайными факторами.

Для оценки достоверности полученного результата вычисленный на экспериментальных данных критерий Фишера сравнивают с его критическим значением (F_Крит.) для принятого уровня вероятности (p) и степеней свободы (df ).

С целью уменьшения объема вычислений в программе Excel может применяться надстройка «Анализ данных» и ее модуль «Однофакторный дисперсионный анализ».

Развернуть

Открыть в широком формате

– Конец работы –

Эта тема принадлежит разделу:

По медицинской статистике

В И Сабанов... Н В Эккерт...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: X. Дисперсионный анализ

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Профессора В.З. Кучеренко
Волгоград 2013 МИНИСТЕРСТВО ЗДРАВООХРАНЕНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ Первый московский государственный медицинский

I. Базовые принципы применения программы Excel
Широкое распространение компьютерной техники, а также достижения информатики позволяют использовать персональные компьютеры, оснащенные прикладным программным обеспечением с целью п

Заполнение табличного документа протокола работы студента.
а) В общей папке учебной группы откройте табличный документ с именем «Статистика–Фамилии студентов». Измените название «Лист1» на «Титул». б) Создайте новый лист и у

О теории вероятностей
Теория вероятностей — это математическая наука, изучающая закономерности массовых случайных явлений (событий). Даже само высказывание "вычислить вероятность" содержит пара

Определение вероятности
Вероятностью P(A) события называется отношение числа m исходов опыта, благоприятствующих событию A, к общему числу n

Действия над событиями
Сложение вероятности событий: Сложением (или объединением) двух событий A и В называется событие С, заключающееся в том, что произойдет по крайней мере одно из

Элементы комбинаторики
Выбор способа нахождения числа возможных перестановок и комбинаций k элементов из их общего числа n выполняется с учетом комбинаторных конфигураций. Основными комбинаторными конфигурациями являются

Формула Байеса
Теорема Байеса (или формула Байеса) – это одна из основных теорем теории вероятностей, которая позволяет определить вероятность того, что произошло какое-либо событие (гипотеза) при наличии

III. Организация и этапы статистического исследования
В любом медико-биологическом и социально-гигиеническом исследовании ведущая роль отводится проведению статистического наблюдени

IV. Статистические таблицы
Каждое медико-биологическое или социально-гигиеническое исследование начинается с этапа планирования эксперимента. На этом этапе необходимо разработать макеты ста

V. Относительные величины, динамические ряды
Для характеристики изучаемой статистической совокупности используются относительные величины, расчет которых проводится на третьем этапе статистического исследования. Относительные величин

VI. Вариационные ряды, средние величины, вариабельность признака
Особое место в статистическом анализе принадлежит определению среднего уровня изучаемого признака или явления. Средний уровень признака измеряют средними величинами. Средняя величина харак

Вывод: средняя частота пульса пациентов изучаемой группы составляет 121,9 ударов в минуту, вариабельность пульса малая.
б) Преобразование не ранжированного вариационного ряда в ранжированный (таблица 14) производится в имеющей таблице простого ряда с помощью команды сортировки по столбцу V

Вывод: Средняя частота пульса пациентов 2-го отделения с вероятностью 95,5% составляет 126,2±2,04 ударов в минуту, вариабельность малая.
б) Создание сгруппированного вариационного ряда (таблица 18) и построение графика распределения (рис. 11). Таблица 18 Сгруппированный, ранжированный

VII. Проверка статистических гипотез, критерий Стьюдента
В научно-исследовательской практике часто требуется сопоставить средние арифметические, например, при сравнении результатов в контрольной и экспериментальной группах, при оценке показателей здоровь

VIII. Проверка статистических гипотез, критерий Хи-квадрат
Анализ характера распределения данных (его еще называют проверкой на нормальность распределения) осуществляется по каждому параметру. Если установлено, что признак не является норма

IX. Метод стандартизации
Основным принципом подбора групп статистического наблюдения в случае необходимости сравнения между ними является однородность сравниваемых совокупностей по характеризующим признакам

XI. Метод корреляции
При проведении исследования в биологии или медицине, как правило, регистрируются множество учетных признаков. Представляет интерес вопрос об их взаимном изменении, т.е. обнаружение

Вывод: зависимость изменения двух изучаемых параметров является сильной прямой и статистически достоверной при уровне значимости p<0,05.
г) вычисление и оценка коэффициента корреляции методом Спирмена. В таблице вариационных рядов производится подсчет рангов как показано в таблице 34. Каждому

XII. Метод регрессии
Метод регрессии - это статистический способ поиска функции, которая позволяет по величине одного коррелируемого признака судить о величине другого. С помощью регрессии ставится задача выясни

Патологоанатомических вскрытий
Заболевания Число патологоанатомических вскрытий Инфаркт миокарда Язвенная болезнь желудка

Патологоанатомических вскрытий
Заболевания Число несовпадений диагнозов Пол Всего М Ж Инфаркт миокарда

Патологоанатомических вскрытий
Заболевания Возраст Всего 0-16 лет 17-60 лет 61 и более М Ж

СОВПАДЕНИЕ ДИАГНОЗОВ ЛПУ С ДАННЫМИ ПАТОЛОГОАНАТОМИЧЕСКИХ ВСКРЫТИЙ
Причины смерти по данным ЛПУ Число пат. анатомических вскрытий Число несовпадений диагнозов Инфаркт миокарда

УТОЧНЕНИЕ ПРИЧИН СМЕРТИ ПО ДАННЫМ ПАТОЛОГОАНАТОМИЧЕСКИХ ВСКРЫТИЙ
Причины смерти по данным ЛПУ Число пат.анат. вскрытий Число несовпадений диагнозов Инфаркт миокарда

Критические значения критерия Шапиро-Уилкса
Число наблюдений, n Критическое значение критерия W для уровня вероятности p p=0,01 p=0,05

Критические значения критерия F-Фишера при p=0,05
df2 Степени свободы df1

Список сокращений
ANOVA – дисперсионный анализ (от англ. ANalysis Of VAriance); covxy – ковариация признаков x и y