Подготовка, предварительный анализ информации и выбор методов обработки данных
Подготовка, предварительный анализ информации и выбор методов обработки данных - раздел Медицина, МЕДИЦИНСКАЯ ИНФОМАТИКА КАК НАУКА. СТАНДАРТНЫЕ ПРИКЛАДНЫЕ ПРОГРАММНЫЕ СРЕДСТВА В РЕШЕНИИ ЗАДАЧ МЕДИЦИНСКОЙ ИНФОРМАТИКИ Рассмотрим Пример Из Клинической Дисциплины.
Постановка Зада...
Рассмотрим пример из клинической дисциплины.
Постановка задач и планирование исследования. Предпочтительным вариантом является строгий подход, когда до проведения исследования есть полная ясность, для чего предпринимается работа, сколько и каких исследований будет осуществлено, какие методы и почему будут применяться для обработки полученного материала. Это позволяет оптимизировать усилия исследователя и затраты ресурсов.
Данный вариант исследования не исключает использования (целиком или частично) ретроспективных данных (собранных ранее и имеющихся в медицинской документации). В принципе нужно помнить, что в этом случае исследователя подстерегает еще одна «ловушка», связанная с различным толкованием симптомов. Это же может иметь место и при проспективном исследовании с участием группы врачей, особенно придерживающихся различных научных школ. Поэтому помимо списка признаков, характеризующих заболевание, необходимо иметь их стандартные описания. Это в значительной степени позволит избежать различий в толковании одних и тех же симптомов. Однако в клинической практике до сих пор достаточно часто сначала получают данные, а уже затем клиницист решает, каким образом на имеющемся материале получить некий обобщающий результат.
Подготовка данных. Данные для статистического анализа принято готовить в виде таблицы (таблиц). Современные статистические пакеты работают с данными наиболее распространенных в настоящее время форматов, в том числе .dbf и .xls.
В строки таблицы заносятся объекты исследования (например, пациенты), а в столбцы — параметры. Если конкретное значение параметра отсутствует, клетку таблицы оставляют пустой. Если значение параметра равно нулю, оно все равно обязательно вносится. Если пациенты обследовались в динамике, т.е. по каждому больному есть несколько «срезов» параметров, обычно вводится дополнительный столбец, однозначно определяющий для конкретного больного (и соответственно — значений параметров) время исследования (например, номер хирургических суток). Таблицы данных включают в себя столбец (столбцы) группирующих параметров (например, номер группы, исход заболевания, если именно по нему будут исследоваться пациенты, и т.д.).
После занесения данных в таблицу необходимо их проверить: просматривают значения параметров, выявляют те из них, которые сильно отличаются от остальных. Это могут быть как реальные «выпадающие» значения, так и ошибки ввода, которые необходимо устранить.
Перенос (импорт) данных в статистический пакет затруднений не вызывает. Для этого пользуются стандартными возможностями буфера обмена ОС Windows. Можно также применять специальные модули статистических пакетов, например модуль «Управление данными» (Data management) пакета Statistica.
Современные статистические пакеты дают возможность управлять данными: часто при решении задач возникает необходимость объединения или разделения файлов (содержащих таблицы) по условию.
Выбор методов анализа и их реализация. Для грамотного выбора метода обработки данных необходимо знать характер распределения используемых переменных, поэтому предварительный анализ данных начинают с определения характера их распределения.
Распределение элементов выборки по значениям параметра — это совокупность частот встречаемости интервалов его значений в данной выборке. К наиболее часто встречающимся видам распределений относятся: колоколообразное (нормальное, гауссово), полимодальное (чаще — бимодальное), равномерное и др.
К основным характеристикам распределения относятся:
· среднее арифметическое (М) — при непрерывных числовых типах параметров; все значения по выборке сложить и поделить на их количество;
· медиана — значение параметра, делящее распределение параметра пополам; выборка значений параметра ранжируется (по возрастанию или убыванию); если число значений нечетно, то медиана — это центральное значение, если число значений четно, то медиана — это среднее арифметическое двух центральных значений;
· квантили (центили) — весь диапазон значений разбивается на 10 интервалов. Границы между интервалами — квантили, от 10%-го до 90%-го квантиля укладываются 80 % значений;
· квартили — весь диапазон разбивается на четыре интервала: 50%-й квартиль — медиана, кроме нее часто указываются 25%-й и 75%-й квартили, т.е. описывается 50 % наиболее «близких к центру» значений;
· мода — значение параметра с наибольшей частотой встречаемости на выборке;
· асимметрия — характеристика несимметричности распределения элементов выборки относительно среднего арифметического. В случае симметричного распределения значение асимметрии равно нулю.
В медицинских публикациях часто встречается запись значений в виде М± т, где т — стандартная ошибка среднего (standard error of mean). Это допустимо делать в случае нормально распределенного параметра, а к величине т нужно относиться с определенной долей скептицизма. Правда, при увеличении выборки распределение параметра достаточно часто стремится к квазинормальному, и тогда использование т в какой-то мере оправдано. Лучше указывать само выборочное стандартное отклонение (среднее квадратичное отклонение — standard deviation — s), которое характеризует ширину нормального распределения. Основанием для такого подхода является то, что s не уменьшается при увеличении числа наблюдений п; в диапазон М ± s укладывается около 70% значений нормального распределения параметра.
Параметрические методы. Для решения многих клинико-научных задач необходимо формулировать статистические гипотезы. Среди них можно назвать анализ соответствия распределения значений параметра определенному закону, сравнение групп по характеристикам распределения параметров и др.
Статистическая гипотеза — это формально строго сформулированное предположение.
Нулевой (Н0) называют гипотезу, которую исследователь предполагает отклонить (например, об отсутствии различий между группами).
Альтернативная гипотеза(Н1) противоположна нулевой (например, о наличии различий между группами).
Уровень статистической значимости (а) — это пороговое значение для ошибочного отклонения верной нулевой гипотезы (ошибки первого рода). В медицине принято выбирать а = 0,05 или а = 0,01.
Ошибка второго рода — это ошибочное принятие ложной нулевой гипотезы.
В настоящее время в публикациях принято указывать реальное значение р (вероятность ошибки первого рода). Если значение р меньше 0,05, говорят о наличии статистически значимых отличий между выборками параметра.
Статистически значимые различия следует отличать от клинически значимых. Встречаются результаты, значимые статистически, но не значимые с клинической точки зрения, бывает и наоборот. Клинически значимые, но статистически незначимые результаты обычно получаются на малых выборках, а при увеличении выборок они, как правило, подтверждаются и статистически.
Чем распределения отличаются с практической точки зрения? Тем, что наиболее распространенные методы параметрической статистики (например, t-критерий Стьюдента) можно применять только для нормально распределенных величин (колоколообразных распределений). Неправомочное использование t-критерия Стьюдента — самая часто встречающаяся ошибка статистической обработки данных клинических исследований, приводящая к ошибочным выводам.
Непараметрические методы. В клинической медицине и при обработке данных медико-биологических экспериментов в большинстве случаев необходимо пользоваться непараметрическими методами статистического анализа. Они являются менее мощными, чем параметрические, но применимы для любых видов распределений.
Анализ характера распределения данных (его еще называют проверкой на нормальность распределения) осуществляется по каждому параметру. Для проверки на нормальность используют как визуализирующие методы (метод построения гистограмм), так и статистические (например, тест Колмогорова—Смирнова, критерий Шапиро—Уилкса). Для того чтобы уверенно судить о соответствии распределения параметра нормальному закону, необходимо, чтобы выборка была достаточно многочисленной (не менее 50 значений).
Кроме разделения по уже описанному важнейшему статистическому подходу (параметрические, непараметрические) методы статистического анализа данных принято классифицировать несколькими способами:
1) по количеству одновременно анализируемых параметров (одномерные, двухмерные, многомерные или многофакторные);
2) имеющимся исходно предположениям о характере распределений выборок (односторонние тесты — при наличии предположения о смещении распределения
В настоящее время в своей профессиональной деятельности врач любой специальности при решении задач медицинской науки и практики обязательно... Предлагаемый учебник принципиально отличается от издавав шихся ранее учебных... В гл дана подробная историческая справка Рассматриваются науки на основе которых зародилась медицинская...
СПИСОК СОКРАЩЕНИЙ
АИС — автоматизированная информационная система
АРМ — автоматизированное рабочее место АС — автоматизированная система
АСУ — автоматизированная система управления
АЦП — а
Исторический обзор
Прежде чем начать изучать МИ, следует узнать ее историю. Слово «кибернетика» в Древней Греции означало науку об искусстве управления и относилось к управлению кораблями. В СССР в середине ХХ в. киб
Место медицинской информатики в здравоохранении
Информатика как самостоятельная наука появилась в конце XX в. Хотя, как удачно заметил Г. А. Хай (2007), информатика су шествовала с момента возникновения человеческого общества, но не имела этого
Применение текстового редактора в медицинских задачах
В предыдущей главе уже упоминалось, что при решении задач медицинской информатики можно использовать стандартные программные средства, хотя все чаще для этого применяют специально разработанные п
Применение электронных таблиц при работе с медицинскими данными
Табличные процессоры (электронные таблицы) — удобное средство для проведения расчетов, построения диаграмм и анализа данных. Наиболее распространенные электронные таблицы MS Excel имеют бол
Программные средства математической статистики
Математическая статистика — универсальный инструмент для анализа любых данных, в том числе экспериментальных клинических и биомедицинских. Но выбираемый метод должен отвечать поставленной цели и
Особенности медицинских данных
Первым шагом, предваряющим собственно статистический анализ, является исследование типа данных, основными из которых являются количественные и качественные.
Качественные данные подразделя
Использование методов математической статистики для анализа данных
В учебном издании по медицинской информатике было бы излишне приводить подробные описания методов математической статистики, тем более что в последние годы вышло достаточно большое количество спец
Интерпретация и представление полученных результатов
В настоящее время написание клинического отчета, научной статьи и тем более диссертации невозможно без грамотного представления результатов, полученных с помощью методов математической статистики
Понятие телемедицины
Телемедицина и Интернет, не являясь в прямом смысле составными частями медицинской информатики, характеризуются общими тенденциями развития.
Создание региональных и федеральных сетей опир
Этапы становления российской телемедицины
На первом этапе становления отечественной телемедицины (1960-1990-е гг.) появились такие достижения, как телеметрическая оценка параметров жизнедеятельности космонавтов, международные телеме
Телеконсультирование, теленаблюдение и телепомощь
Чрезвычайно важно организовывать телемедицинскую консультативную помощь в отношении социально значимых и трудно дифференцируемых заболеваний. Телеконсультации и телеконсилиумы с участием группы вра
Дистанционное обучение
Дистанционное преподавание все шире распространяется в развитых и развивающихся странах. Оно приобретает особое значение для повышения квалификации в связи с ускорением развития медицинской науки
Медицинские ресурсы сети интернет
Интернет — всемирная ИС, т.е. совокупность разных сетей, построенных на базе протокола TCP/IP (Transmission Control Protocol/Internet P-Protocol), т.е. протокола управления передачей в сети,
Общие требования к информационным медицинским системам
Основным документом, определяющим требования и порядок разработки АС (в том числе медицинских), является техническое задание (ТЗ).
Техническое задание на АС может включать следующие подра
Моделирование и использование моделей в медицине
Модель — это создаваемое человеком подобие изучаемого объекта (макет, изображение, схема, карта, словесное описание, математическое представление и т.п.). Метод моделирования состоит в исследован
Медико-технологические системы и их особенности
Медико-технологические системы — это системы, обеспечивающие обработку и анализ информации, представленной в электронной форме, для поддержки принятия решений и информационной поддержки медицинс
Особенности интеллектуальных автоматизированных рабочих мест
Интеллектуальное АРМ — это программный продукт, в котором некоторая часть или все модули поддержки процесса принятия решений реализованы с использованием систем, основанных на знаниях (экспертных
Специализированные рабочие места
Понятие «типовое АРМ» базируется на общих принципах его построения и функционирования. Это необходимое условие для разработки совместимых АРМ. Такой подход не исключает, однако, того, что в реальн
Информационно-технологические системы диспансерного наблюдения
Автоматизированные системы диспансерных осмотров населения могут быть как самостоятельными (для поддержки первичной диспансеризации или массовых медицинских осмотров), так и являться составной час
Электронная история болезни
Электронная история болезни (ЭИБ) — это информационная система, обеспечивающая автоматизацию ведения и формирования медицинской документации, оперативный обмен между участниками ЛДП и поддержку и
Права доступа к информации и конфиденциальность медицинских данных
К информации БД медицинских ИТС в силу своей деятельности имеют доступ многочисленные пользователи — от врачей (и даже медицинских сестер) до руководителей здравоохранения различного уровня. И это
Концепции разработки информационных систем лечебных учреждений
За рубежом внедрение АИС учрежденческого уровня достаточно давно считается совершенно необходимой и естественной составляющей деятельности здравоохранения. В развитых странах АИС ЛПУ разрабатываю
Функциональное назначение учрежденческих систем
Основной целью информатизации ЛПУ является повышение эффективности их деятельности: улучшение качества профилактического и лечебно-диагностического процессов, сокращение времени на их проведение
Технологические решения
В настоящее время в крупных медицинских учреждениях России успешно внедряются несколько десятков различных АИС ЛПУ, разработанных с использованием разных технологических решений. Рассмотрим некот
Информационно-аналитические системы
Информационно-аналитическая система — это система, обеспечивающая наряду с процессами сбора, накопления, хранения, поиска и статистической обработки информации формально-содержате
Географические информационные системы
Географическая информационная (геоинформационная) система (ГИС) — это система визуального представления географически или координатно «привязанной» проблемно-орие
Федеральные системы мониторинга состояния здоровья
Федеральная информационная система мониторинга состояния здоровья — это комплекс проблемно ориентированных иерархических ИМС, включающих регулярно обновляемые персонифицированные базы медицински
Понятие электронного здравоохранения
Переход к электронному здравоохранению (e-Health) предполагает построение территориальных и глобальных сетей передачи медицинских данных и создание на этой основе единого информационного п
Принципы построения единого информационного пространства
Информационное пространство данных медицинского и социального плана для поддержки принятия решений клинического и организационного характера в зависимости от общей направленности включает информа
Подходы и первый опыт электронного здравоохранения
В настоящее время с учетом новых технических возможностей началось создание региональных и моделирование глобальных медицинских систем, позволяющих объединять автономно функционирующие в отдельных
Возможности электронного здравоохранения
Рассматривая понятие «электронное здравоохранение» как систему оперативного доступа к персонифицированной информации корпоративных систем или распределенных БД с использованием телекоммуникацион
ТЕРМИНОЛОГИЧЕСКИЙ СЛОВАРЬ
Автоматизированные рабочие места медицинских работников — комплексы, обеспечивающие ведение базы данных, обработку информации и поддержку процессов принятия решений в определенной
Хотите получать на электронную почту самые свежие новости?
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Новости и инфо для студентов