Использование методов математической статистики для анализа данных
Использование методов математической статистики для анализа данных - раздел Медицина, МЕДИЦИНСКАЯ ИНФОМАТИКА КАК НАУКА. СТАНДАРТНЫЕ ПРИКЛАДНЫЕ ПРОГРАММНЫЕ СРЕДСТВА В РЕШЕНИИ ЗАДАЧ МЕДИЦИНСКОЙ ИНФОРМАТИКИ В Учебном Издании По Медицинской Информатике Было Бы Излишне Приводить Подро...
В учебном издании по медицинской информатике было бы излишне приводить подробные описания методов математической статистики, тем более что в последние годы вышло достаточно большое количество специальной литературы, рассчитанной на практикующего врача, с описанием как наиболее часто использующихся методов, так и работы со статистическими пакетами. Поэтому здесь мы ограничимся лишь краткими сведениями, полезными для клинициста, но не достаточными для приобретения реальных знаний по математической статистике.
Сравнение двух независимых групп по одному параметру. t-Критерий Стьюдента для независимых выборок (групп) является наиболее популярным методом решения этой задачи, суть которой сводится к проверке того, различаются ли средние значения параметра в сравниваемых группах. Критерий корректно использовать только при условии нормального распределения параметров в каждой группе и равенства дисперсий распределений параметров в группах.
Суть применения t-критерия Стьюдента для независимых выборок заключается в проверке нулевой гипотезы о том, что средние значения параметра в группах не различаются. Если нулевая гипотеза по результатам анализа отклоняется (р < 0,05), принимается альтернативная гипотеза о том, что средние значения параметров в группах различаются.
Правомочно использовать t-критерий Стьюдента для независимых выборок лишь при достаточно большом объеме выборок, что в клинической медицине бывает редко.
Кроме «классического» t-критерия Стьюдента существует его модификация, не требующая равенства дисперсий распределений параметров в группах.
В настоящее время, когда врачи становятся более сведущими в математической статистике, критерий Манна-Уитни (Мапп — Whitney U-test) используют почти так же часто, как t-критерий. Его применяют для сравнения выборок по количественным параметрам в случаях, когда хотя бы одна из сопоставляемых выборок имеет распределение, отличное от нормального, или если характер распределения параметра неизвестен (проверка на нормальность не проводилась).
Суть метода заключается в проверке нулевой гипотезы о равенстве средних рангов в группах, т.е. до проверки гипотезы осуществляется ранжирование значений параметра в каждой группе. Если нулевая гипотеза отклоняется, принимается альтернативная гипотеза о том, что между рангами групп есть различия.
Сравнение двух зависимых групп по одному параметру. t-Критерий Стьюдента для зависимых выборок, так же как и t-критерий Стьюдента для независимых выборок, можно применять только при условии нормального распределения параметров в каждой группе и равенства дисперсий распределений параметров в группах. В большинстве случаев на реальных клинических данных эти условия не выполняются, поэтому применение метода не правомочно.
Критерий Вилкоксона (Wilcoxon matched pairs test) — один из самых мощных непараметрических критериев. Его используют для парного сравнения выборок количественных (или качественных порядковых) параметров в тех случаях, когда хотя бы в одной из анализируемых выборок распределение величин параметра не является нормальным.
При применении критерия Вилкоксона проверяется нулевая гипотеза об отсутствии различий выборок. Если она отклоняется (р < 0,05), принимается альтернативная — об их наличии.
Анализ взаимосвязи двух параметров. Общепринятым способом выявления взаимосвязи между переменными является расчет корреляции.
Следует подчеркнуть, что обнаружение корреляции между двумя переменными не свидетельствует о существовании причинной связи между ними, а лишь указывает на возможность таковой (или фактора, определяющего изменение обеих переменных).
Обычно при использовании методов корреляции перед исследователем возникает вопрос о тесноте связи (степени сопряженности) переменных. Если каждому заданному значению одной переменной соответствуют близкие друг к другу, тесно расположенные около средней величины значения другой переменной, то связь является более тесной; если эти значения сильно варьируют, связь менее тесная. Таким образом, мера корреляции (значение коэффициента корреляции г) указывает, насколько тесно связаны между собой параметры. Чем больше коэффициент корреляции, тем с большей степенью уверенности можно говорить о наличии линейной зависимости между параметрами.
Условно выделяют следующие уровни корреляционной связи: слабая — около 0,3; умеренная — от 0,31 до 0,5; заметная — от 0,51 до 0,7; высокая — 0,71 и более.
По форме корреляция бывает прямой (при увеличении значений первой переменной значения второй также увеличиваются) и обратной (при увеличении значений первой переменной значения второй убывают). Коэффициент корреляции г принимает значения от -1 до +1. Обсуждать наличие корреляции имеет смысл только в тех случаях, когда она статистически значима (р < 0,05). Отсутствие линейной корреляции не означает, что параметры независимы: связь между ними может быть нелинейной.
Наиболее часто применяемыми в настоящее время методами исследования корреляции являются параметрический анализ по Пирсону и непараметрический анализ по Спирмену.
Корреляционный анализ по Пирсону используется при решении задачи исследования линейной связи двух нормально распределенных параметров. Проверяется нулевая гипотеза об отсутствии связи между параметрами, т.е. что г- 0. Кроме проверки на нормальность распределения каждого параметра до проведения корреляционного анализа рекомендуется строить график в координатах оцениваемых параметров, чтобы визуально определить характер зависимости. Если нулевая гипотеза отклоняется (р < 0,05), можно говорить о наличии значимой взаимосвязи между параметрами.
Корреляционный анализ по Спирмену применяется для исследования взаимосвязи двух параметров, если распределение хотя бы одного из них отлично от нормального. Проверяется нулевая гипотеза о том, что коэффициент корреляции равен нулю. Если нулевая гипотеза отклоняется (р < 0,05), взаимосвязь между параметрами есть.
Одновременный анализ трех и более параметров. Наряду с методами одномерного и двухмерного анализа существует большое количество методов многомерного (многофакторного) анализа данных. Они дают возможность одновременно анализировать три и более переменные. К наиболее используемым методам многомерного анализа относятся: регрессионный анализ, дискриминантный анализ, кластерный анализ, дисперсионный анализ, анализ главных компонентов, факторный анализ.
В клинических работах методы многофакторного анализа используются гораздо реже, чем описательная статистика, методы сравнения двух групп по параметру и корреляционный анализ, I хотя в последние годы наметилась тенденция к более широкому 1 применению регрессионного анализа.
Регрессионный анализ представляет собой метод статистического анализа, позволяющий исследовать вид зависимости одного параметра от нескольких других. Наряду с дискриминантным и кластерным он является одним из методов статистического моделирования. Моделью при этом является получаемое уравнение регрессии. С помощью рассчитываемых в ходе peгрессионного анализа константы и коэффициентов можно прогнозировать величину исследуемого параметра в зависимости от значений других переменных. В отличие от корреляционного анализа, который лишь дает возможность установления факта взаимосвязи параметров, он описывает вид зависимости переменных.
Регрессионный анализ подразделяют на однофакторный (один независимый параметр) и многофакторный (два и более независимых параметра), а также линейный и нелинейный.
Линейный регрессионный анализ используется в тех случаях, когда все задействованные в нем параметры являются нормально распределенными, количество значений параметров намного превышает количество самих параметров и т.д. Число ограничений на корректное проведение регрессионного анализа достаточно велико.
Самым употребляемым видом нелинейного регрессионного анализа в настоящее время является логистический. Главными условиями его применения является возможность принятия зависимым параметром только двух значений (например, есть заболевание — единица, нет заболевания — нуль). Все остальные параметры, задействованные в анализе, должны быть независимыми, при этом они могут быть любыми по типу — как количественными, так и качественными.
Дискриминантный анализ — это один из методов решения задачи классификации — разработки правила отнесения исследуемого объекта к одной из нескольких групп на основании величин выделенных параметров.
Кластерный анализ является методом статистической группировки объектов или параметров исследования в кластеры (от англ. cluster — гроздь, скопление) — подмножества исследуемой выборки.
Использование в практической деятельности врача методов многофакторного статистического анализа выходит за рамки необходимых знаний и навыков, которыми он должен владеть. Их применение требует глубоких знаний математической статистики, определенного опыта работы с медицинскими данными, а порой — даже искусства. I
В настоящее время в своей профессиональной деятельности врач любой специальности при решении задач медицинской науки и практики обязательно... Предлагаемый учебник принципиально отличается от издавав шихся ранее учебных... В гл дана подробная историческая справка Рассматриваются науки на основе которых зародилась медицинская...
СПИСОК СОКРАЩЕНИЙ
АИС — автоматизированная информационная система
АРМ — автоматизированное рабочее место АС — автоматизированная система
АСУ — автоматизированная система управления
АЦП — а
Исторический обзор
Прежде чем начать изучать МИ, следует узнать ее историю. Слово «кибернетика» в Древней Греции означало науку об искусстве управления и относилось к управлению кораблями. В СССР в середине ХХ в. киб
Место медицинской информатики в здравоохранении
Информатика как самостоятельная наука появилась в конце XX в. Хотя, как удачно заметил Г. А. Хай (2007), информатика су шествовала с момента возникновения человеческого общества, но не имела этого
Применение текстового редактора в медицинских задачах
В предыдущей главе уже упоминалось, что при решении задач медицинской информатики можно использовать стандартные программные средства, хотя все чаще для этого применяют специально разработанные п
Применение электронных таблиц при работе с медицинскими данными
Табличные процессоры (электронные таблицы) — удобное средство для проведения расчетов, построения диаграмм и анализа данных. Наиболее распространенные электронные таблицы MS Excel имеют бол
Программные средства математической статистики
Математическая статистика — универсальный инструмент для анализа любых данных, в том числе экспериментальных клинических и биомедицинских. Но выбираемый метод должен отвечать поставленной цели и
Особенности медицинских данных
Первым шагом, предваряющим собственно статистический анализ, является исследование типа данных, основными из которых являются количественные и качественные.
Качественные данные подразделя
Интерпретация и представление полученных результатов
В настоящее время написание клинического отчета, научной статьи и тем более диссертации невозможно без грамотного представления результатов, полученных с помощью методов математической статистики
Понятие телемедицины
Телемедицина и Интернет, не являясь в прямом смысле составными частями медицинской информатики, характеризуются общими тенденциями развития.
Создание региональных и федеральных сетей опир
Этапы становления российской телемедицины
На первом этапе становления отечественной телемедицины (1960-1990-е гг.) появились такие достижения, как телеметрическая оценка параметров жизнедеятельности космонавтов, международные телеме
Телеконсультирование, теленаблюдение и телепомощь
Чрезвычайно важно организовывать телемедицинскую консультативную помощь в отношении социально значимых и трудно дифференцируемых заболеваний. Телеконсультации и телеконсилиумы с участием группы вра
Дистанционное обучение
Дистанционное преподавание все шире распространяется в развитых и развивающихся странах. Оно приобретает особое значение для повышения квалификации в связи с ускорением развития медицинской науки
Медицинские ресурсы сети интернет
Интернет — всемирная ИС, т.е. совокупность разных сетей, построенных на базе протокола TCP/IP (Transmission Control Protocol/Internet P-Protocol), т.е. протокола управления передачей в сети,
Общие требования к информационным медицинским системам
Основным документом, определяющим требования и порядок разработки АС (в том числе медицинских), является техническое задание (ТЗ).
Техническое задание на АС может включать следующие подра
Моделирование и использование моделей в медицине
Модель — это создаваемое человеком подобие изучаемого объекта (макет, изображение, схема, карта, словесное описание, математическое представление и т.п.). Метод моделирования состоит в исследован
Медико-технологические системы и их особенности
Медико-технологические системы — это системы, обеспечивающие обработку и анализ информации, представленной в электронной форме, для поддержки принятия решений и информационной поддержки медицинс
Особенности интеллектуальных автоматизированных рабочих мест
Интеллектуальное АРМ — это программный продукт, в котором некоторая часть или все модули поддержки процесса принятия решений реализованы с использованием систем, основанных на знаниях (экспертных
Специализированные рабочие места
Понятие «типовое АРМ» базируется на общих принципах его построения и функционирования. Это необходимое условие для разработки совместимых АРМ. Такой подход не исключает, однако, того, что в реальн
Информационно-технологические системы диспансерного наблюдения
Автоматизированные системы диспансерных осмотров населения могут быть как самостоятельными (для поддержки первичной диспансеризации или массовых медицинских осмотров), так и являться составной час
Электронная история болезни
Электронная история болезни (ЭИБ) — это информационная система, обеспечивающая автоматизацию ведения и формирования медицинской документации, оперативный обмен между участниками ЛДП и поддержку и
Права доступа к информации и конфиденциальность медицинских данных
К информации БД медицинских ИТС в силу своей деятельности имеют доступ многочисленные пользователи — от врачей (и даже медицинских сестер) до руководителей здравоохранения различного уровня. И это
Концепции разработки информационных систем лечебных учреждений
За рубежом внедрение АИС учрежденческого уровня достаточно давно считается совершенно необходимой и естественной составляющей деятельности здравоохранения. В развитых странах АИС ЛПУ разрабатываю
Функциональное назначение учрежденческих систем
Основной целью информатизации ЛПУ является повышение эффективности их деятельности: улучшение качества профилактического и лечебно-диагностического процессов, сокращение времени на их проведение
Технологические решения
В настоящее время в крупных медицинских учреждениях России успешно внедряются несколько десятков различных АИС ЛПУ, разработанных с использованием разных технологических решений. Рассмотрим некот
Информационно-аналитические системы
Информационно-аналитическая система — это система, обеспечивающая наряду с процессами сбора, накопления, хранения, поиска и статистической обработки информации формально-содержате
Географические информационные системы
Географическая информационная (геоинформационная) система (ГИС) — это система визуального представления географически или координатно «привязанной» проблемно-орие
Федеральные системы мониторинга состояния здоровья
Федеральная информационная система мониторинга состояния здоровья — это комплекс проблемно ориентированных иерархических ИМС, включающих регулярно обновляемые персонифицированные базы медицински
Понятие электронного здравоохранения
Переход к электронному здравоохранению (e-Health) предполагает построение территориальных и глобальных сетей передачи медицинских данных и создание на этой основе единого информационного п
Принципы построения единого информационного пространства
Информационное пространство данных медицинского и социального плана для поддержки принятия решений клинического и организационного характера в зависимости от общей направленности включает информа
Подходы и первый опыт электронного здравоохранения
В настоящее время с учетом новых технических возможностей началось создание региональных и моделирование глобальных медицинских систем, позволяющих объединять автономно функционирующие в отдельных
Возможности электронного здравоохранения
Рассматривая понятие «электронное здравоохранение» как систему оперативного доступа к персонифицированной информации корпоративных систем или распределенных БД с использованием телекоммуникацион
ТЕРМИНОЛОГИЧЕСКИЙ СЛОВАРЬ
Автоматизированные рабочие места медицинских работников — комплексы, обеспечивающие ведение базы данных, обработку информации и поддержку процессов принятия решений в определенной
Хотите получать на электронную почту самые свежие новости?
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Новости и инфо для студентов