рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

П. 10. Понятие о статистических гипотезах. Критерии согласия

П. 10. Понятие о статистических гипотезах. Критерии согласия - раздел Образование, П. 8. Корреляция С Теорией Статистического Оценивания Параметров Тесно Связана Проверка Статис...

С теорией статистического оценивания параметров тесно связана проверка статистических гипотез.Поскольку статистика как метод исследования имеет дело с данными, в которых интересующие исследователя закономерности искажены различными случайными факторами, большинство статистических вычислений сопровождается проверкой некоторых предположений или гипотез об источнике этих данных. Например, фасовочная машина должна наполнять пакеты сахаром по 1 кг. Как узнать, действительно ли генеральная совокупность подчиняется этим ограничениям? С этой целью проводят испытание гипотез. Из генеральной совокупности проводят выборку объема n. Для этой выборки вычисляют нужные характеристики. Затем формулируют гипотезы.

Определение 37.Статистической гипотезой называется любое предположение о виде неизвестного закона распределения или о параметрах известного распределения (иначе, статистическая гипотеза – это предположение о свойствах случайных величин или событий, которое мы хотим проверить по имеющимся данным).

Примеры статистических гипотез: 1) успеваемость группы вероятностно (стохастически) зависит от уровня обучаемости студентов, 2) усвоение начального курса математики в школе не имеет существенных различий у школьников, начавших обучение с 6 или с 7 лет.

Теория статистического оценивания используется всякий раз, когда необходим обоснованный вывод о преимуществах того или иного способа инвестиций, измерений, стрельбы, технологического процесса, об эффективности нового метода обучения, управления, о пользе вносимого удобрения, принимаемого лекарства, о значимости математической модели и т.д.

 

Сформулированных гипотез – две: основная и альтернативная.

Определение 38.Проверяемую гипотезу называют нулевой или основной и обозначают Н0.

Нулевая гипотеза – это основное проверяемое предположение, которое обычно формулируется как отсутствие различий, отсутствие влияние фактора, отсутствие эффекта, равенство нулю значений выборочных характеристик и т.п.

Примером нулевой гипотезы является утверждение о том, что различие в результатах выполнения двумя группами студентами одной и той же контрольной работы вызвано лишь случайными причинами.

 

Определение 39.Противоположную или противоречащую выдвинутой гипотезе Н0 гипотезу Н1 называют альтернативной или конкурирующей.

Альтернативная или конкурирующая гипотеза - это другое проверяемое предположение (не всегда строго противоположное или обратное первому). Так, для упомянутого выше примера гипотезы Н0 в педагогике одна из возможных альтернатив Н1 будет определена как: уровни выполнения работы в двух группах студентов различны, и это различие определяется влиянием неслучайных факторов, например, тех или других методов обучения.

Например, гипотеза Н0 имеет вид: генеральная средняя а = 2. Альтернативная гипотеза Н1 в этом примере может быть сформулирована любым из трех следующих способов:

1) Н1 : а > 2 (правосторонняя проверка),

2) Н1 : а < 2 (левосторонняя проверка),

3) Н1 : а ≠ 2 (двусторонняя проверка).

Пример.Основная гипотеза Н0 имеет вид: а = 10. То конкурирующей может быть гипотеза:

1) Н1 : а > 10 , 2) Н1 : а ≥ 10; 3) Н1 : а ≥ 5 4) Н1 : а ≤ 10. Выбрать правильный ответ или ответы.

Ответ. № 1.Н1 : а > 10. Остальные гипотезы не противоречат нулевой.

 

Выдвинутая гипотеза может быть правильной или неправильной, поэ­тому возникает необходимость проверить ее. Так как проверку произво­дят статистическими методами, то данная проверка называется статистической.

Общая постановка задачи проверки гипотез. Имеются две противоположные гипотезы Н0 и Н1 и некоторая связанная с ними случайная величина У. Пусть у обозначает числовое значение случайной величины У, полученное в результате испытания, Δ – множество всех возможных значений СВ У. Требуется произвести проверку нулевой гипотезы относительно конкурирующей на основании результатов испытания. Разобьем множество Δ на две части Δ1 и Δ2 с условием принятия гипотезы Н0 при попадании значения у СВ У в результате опыта в Δ1 и гипотезы Н1 – при попадании у в Δ2. Выбор решающего правила разбиения множества Δ на две части Δ1 и Δ2 в любой задаче проверки гипотез возможен больше, чем одним способом. Спрашивается: какое из всех возможных разбиений считать наилучшим?

Определение 40. Статистика критерия — некоторая функция Т от исходных данных, по значению которой проверяется нулевая гипотеза. Чаще всего статистика критерия является числовой функцией, но она может быть и любой другой функцией, например, многомерной функцией.

Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приближенное распределение которой известно.

Определение 41.Всякое правило, на основе которого отклоняется или принимается нулевая гипотеза называется критериемдля проверки данной гипотезы.

Определение 42.Случайная величина К, которая служит для проверки нулевой гипотезы, называется статистическим критерием.

Т.е. критерий – это некое правило, которое сопоставляет каждому возможному значению или всему множеству возможных значений случайной величины У, связанной с двумя противоположными гипотезами Н0 и Н1, одну из гипотез.

 

В итоге статистической проверки гипотез могут быть допущены ошибкидвух типов:

1) ошибка первого рода состоит в том, что отвергнута нулевая гипотеза, когда она верна. Вероятность совершить ошибку первого рода обозначают α и называют уровнем значимости,

Определение 43.Уровень значимости – это вероятность ошибки первого рода при принятии решения (вероятность ошибочного отклонения нулевой гипотезы) – ложноположительное решение.

Другая интерпретация: уровень значимости — это такое (достаточно малое) значение вероятности события, при котором событие уже можно считать неслучайным. В стандартной методике проверки статистических гипотез уровень значимости фиксируется заранее, до того, как становится известной выборка.

α = 1 – р, где р – доверительная вероятность (задается исследователем), то есть величина которая отражает степень уверенности исследователя в результатах испытаний. Для односторонней проверки α = 1 – р, для двусторонней проверки α = (1 – р)/2.

2) ошибка второго рода состоит в том, что принята нулевая гипотеза, когда верна конкурирующая – ложноотрицательное решение. Вероятность совершить ошибку второго рода обозначают β.

Чрезмерное уменьшение уровня значимости α может привести к увеличению вероятности ошибки второго рода β.

Определение 44.Вероятность γ = (1 – β) того, что нулевая гипотеза будет отвергнута, если верна конкурирующая, называют мощностью критерия.

Выбор уровня значимости требует компромисса между значимостью и мощностью или (что то же самое, но другими словами) между вероятностями ошибок первого и второго рода. Последствия этих ошибок могут оказаться различными, они зависят от конкретной задачи. Ошибка, состоящая в принятии нулевой гипотезы, когда она ложна, качественно отличается от ошибки, состоящей в отвержении гипотезы, когда она истинна. Эта разница очень существенна вследствие того, что различна значимость этих ошибок. Проиллюстрируем вышесказанное на следующем примере.

Пример. Процесс производства некоторого медицинского препарата весьма сложен. Несущественные на первый взгляд отклонения от технологии вызывают появление высокотоксичной побочной примеси. Токсичность этой примеси может оказаться столь высокой, что даже такое ее количество, которое не может быть обнаружено при обычном химическом анализе, может оказаться опасным для человека, принимающего это лекарство. В результате, прежде чем выпускать в продажу вновь произведенную партию, ее подвергают исследованию на токсичность биологическими методами. Малые дозы лекарства вводятся некоторому количеству подопытных животных, например, мышей, и результат регистрируют. Если лекарство токсично, то все или почти все животные гибнут. В противном случае норма выживших велика. Исследование лекарства может привести к одному из возможных способов действия: выпустить партию в продажу (а1), вернуть партию поставщику для доработки или, может быть, для уничтожения (а2). Ошибки двух видов, связанные с действиями а1 и а2 совершенно различны, различна и важность избегания их. Сначала рассмотрим случай, когда применяется действие а1, в то время когда предпочтительнее а2. Лекарство опасно для пациента, в то время как оно признано безопасным. Ошибка этого вида может вызвать смерть пациентов, употребляющих этот препарат. Это ошибка первого рода, так как нам важнее ее избежать. Рассмотрим случай когда предпринимается действие а2, в то время когда а1 является более предпочтительным. Это означает, что вследствие неточностей в проведении эксперимента партия нетоксичного лекарства классифицировалась как опасная. Последствия ошибки могут выражаться в финансовом убытке и в увеличении стоимости лекарства. Однако случайное отвержение совершенно безопасного лекарства, очевидно, менее нежелательно, чем, пусть даже изредка происходящие гибели пациентов. Отвержение нетоксичной партии лекарства – ошибка второго рода.

Для проверки гипотезы по выборке вычисляют значение критерия и получают так называемое наблюдаемое значение критерия Кнабл.

Определение 45.Критической областью называют совокупность значений критерия, при которых нулевая гипотеза отвергается и принимается альтернативная.

Определение 46.Областью принятия гипотезы называют совокупность значений критерия, при которых нулевая гипотеза принимается.

Основной принцип проверки статистических гипотез: если наблюдаемое значение критерия принадлежит критической области, гипотезу отвергают; если наблюдаемое значение критерия принадлежит области принятия гипотезы, гипотезу принимают.

Определение 47.Точки, отделяющие критическую область от области принятия гипотезы, называют критическими точками и обозначают Ккр.

Различают следующие критические области: 1) правосторонняя, т.е. (Ккр; +∞), 2) левосторонняя, т.е. (–∞; Ккр), 3) двусторонняя, т.е . (–∞; К1кр) Ụ (К2кр; +∞), где К1кр < К2кр.

 

Для нахождения критических точек задают достаточно малую вероятность – уровень значимости α, и Ккр. находят из требования:

1) для правосторонней критической области P(K > Kкр.) = α,

2) для левосторонней критической области P(K < Kкр.) = α,

3) для двусторонней критической области P(K < K1кр.) + P(K > K2кр.) = α.

Обычно рекомендуется выбирать уровень значимости из априорных соображений. Однако на практике не вполне ясно, какими именно соображениями надо руководствоваться, и выбор часто сводится к назначению одного из популярных вариантов: α = 0,005; 0,01; 0,05; 0,1. В докомпьютерную эпоху эта стандартизация позволяла сократить объём справочных статистических таблиц. Теперь нет никаких специальных причин для выбора именно этих значений. Для каждого критерия имеются таблицы, по которым и находят приближенную точку, удовлетворяющую необходимому требованию.

Определение 48.Достигаемый уровень значимостиили пи-величина р(Т) – это наименьшая величина уровня значимости, при которой нулевая гипотеза отвергается для данного значения статистики критерия К. (К принадлежит критической области).

Другая интерпретация: достигаемый уровень значимостиили пи-величина— это вероятность, с которой (при условии истинности нулевой гипотезы) могла бы реализоваться наблюдаемая выборка, или любая другая выборка с ещё менее вероятным значением статистики Т.

Случайная величина р(Т(хm)) имеет равномерное распределение. Фактически, функция р(Т) приводит значение статистики критерия Т к шкале вероятности. Маловероятным значениям (хвостам распределения) статистики Т соответствуют значения р(Т), близкие к нулю или к единице. Вычислив значение р(Т(хm)) на заданной выборке хm, статистик имеет возможность решить, является ли это значение достаточно малым, чтобы отвергнуть нулевую гипотезу. Данная методика является более гибкой, чем стандартная. В частности, она допускает «нестандартное решение» — продолжить наблюдения, увеличивая объём выборки, если оценка вероятности ошибки первого рода попадает в зону неуверенности, скажем, в отрезок [0,01; 0,1].

Определение 49. ROC-кривая (receiver operating characteristic) — это зависимость мощности (1 – β) от уровня значимости α.

Методика предполагает, что статистик укажет подходящую точку на ROC-кривой, которая соответствует компромиссу между вероятностями ошибок I и II рода.

Для того чтобы свести к минимуму ошибки, в таблицах критических значений статистических критериев в общем количестве данных не учитывают те, которые можно вывести методом дедукции. Оставшиеся данные составляют так называемое число степеней свободы.

Определение 50. Число степеней свободы-число данных из выборки, значения которых могут быть случайными, то есть могут варьироваться.
Так, если сумма трех данных равна 8, то первые два из них могут принимать любые значения, но если они определены, то третье значение становится автоматически известным. Если, например, значение первого данного равно 3, а второго -1, то третье может быть равным только 4. Таким образом, в такой выборке имеются только две степени свободы. В общем случае для выборки в n данных существует п-1 степень свободы. Если у нас имеются две независимые выборки, то число степеней свободы для первой из них составляет n1-1, а для второй — n2-1. А поскольку при определении достоверности разницы между ними опираются на анализ каждой выборки, число степеней свободы, по которому нужно будет находить критерий t в таблице, будет составлять (n1+n2)-2.
Если же речь идет о двух зависимых выборках, то в основе расчета лежит вычисление суммы разностей, полученных для каждой пары результатов (т.е., например, разностей между результатами до и после воздействия на одного и того же испытуемого). Поскольку одну (любую) из этих разностей можно вычислить, зная остальные разности и их сумму, число степеней свободы для определения критерия t будет равно n-1.

Количество степеней свободы может быть не только натуральным, но и любым действительным числом, хотя стандартные таблицы рассчитывают p-value наиболее распространённых распределений только для натурального числа степеней свободы

Пусть нулевая гипотеза принята. Ошибочно думать, что она доказана. Более правильно говорить: данные наблюдений согласуются с нулевой гипотезой и, следовательно, не дают основания ее опровергнуть.

На практике для большей уверенности гипотезу проверяют другими способами или повторяют эксперимент, увеличив объем выборки.

Опровергают гипотезу более категорично, чем принимают. Действительно, достаточно привести один пример, противоречащий некоторому общему утверждению, чтобы это утверждение опровергнуть.

Если функция распределения случайной величины (или плотность распределения) заранее неизвестна, возникает необходимость ее определение по эмпирическим данным. В связи с чем возникает вопрос о согласованности теоретического и статистического (эмпирического) распределения.

Допустим, что данное статистическое распределение выровнено с помощью некоторой теоретической кривой f(x).

 


 

 
 


Как бы хорошо ни была подобрана теоретическая кривая, между нею и статистическим распределением неизбежны некоторые расхождения, которые 1) могут быть объяснены только случайными обстоятельствами, связанными с ограничением числа наблюдений, или 2) являются существенными и связаны с тем, что подобранная кривая плохо выравнивает данное статистическое распределение, то есть что действительное распределение случайной величины отличается от предполагаемого. Для ответа на вопрос, с чем связаны расхождения, служат критерии согласия.

– Конец работы –

Эта тема принадлежит разделу:

П. 8. Корреляция

Если располагаем n точками х у х у хn уn полученными в...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: П. 10. Понятие о статистических гипотезах. Критерии согласия

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

П. 8. Корреляция
  Теория корреляции применяется, как нам уже известно (См. тему «Случайные векторы», для установления связи между двумя случайными величинами Х и У и для установление те

П. 9. Сглаживание экспериментальных зависимостей. Метод наименьших квадратов
При обработке опытных данных часто приходится решать задачу, в которой необходимо исследовать зависимость одной физической величины у от другой физической величины х. Например, исслед

Критерии согласия
  Определение 51. Критерии, которые позволяют судить, согласуются ли значения х1, х2,…, хn случайной величины

Решение.
1) Найдем , где

Пп. 2. Критерий Стьюдента.
  Для определения достоверности разницы средних для двух выборок применяют метод (критерий) Стьюдента или t - критерий. Этот критерий применяется к зависимым выборкам, например

Пп. 3. Критерий Колмогорова.
Данный критерий, как и критерий ,применяется для оценки степени согласованности тео

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги