рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Оценка различия двух выборок

Оценка различия двух выборок - раздел Образование, МЕТОДЫ АНАЛИЗА ДАННЫХ Чтобы Убедиться, Что Две Выборки Действительно Различны С Точки Зрения Значен...

Чтобы убедиться, что две выборки действительно различны с точки зрения значений одной и той же СВ, можно использовать три критерия:

· Крамера-Уэлча, если элементы этих выборок не связаны между собой,

· Вилкоксона-Манна-Уитни, если есть возможность попарно сравнивать между собой элементы этих выборок,

· «хи-квадрат», если СВ измеряется не в непрерывной, а в порядковой шкале (например, балльной)

 

При этом объемы выборок должны быть не менее 10.

 

Проверка по критерию Крамера-Уэлча.

1. Для выборок и с объемами и вычисляются математические ожидания и средние квадратичные отклонения /

2. Вычисляется значение коэффициента по формуле

.

3. Задаются значением доверительной вероятности и по рисунку 5 находят значение коэффициента Стьюдента при .

4. Если , то делается вывод, «выборки и различны с доверительной вероятностью ».

 

Проверка по критерию Вилкоксона-Манна-Уитни.

 

1. Для каждого элемента первой выборки подсчитывается коэффициент, равный количеству элементов второй выборки, у которых значение СВ больше, чем у данного элемента первой выборки. К этому коэффициенту добавляется число, равное половинному количеству элементов второй выборки, у которых значение СВ совпадает со значением СВ для данного элемента первой выборки. Рассчитанные таким образом коэффициенты для всех элементов первой выборки суммируются. Их сумму обозначим через .

2. Рассчитывается коэффициент по формуле

.

3. Задаются значением доверительной вероятности и по рисунку 5 находят значение коэффициента Стьюдента при .

4. Если , то делается вывод, «выборки и различны с доверительной вероятностью ».

 

Проверка по критерию «хи-квадрат».

 

Пусть СВ измеряется в порядковой шкале с различными баллами. Количества объектов в выборках и , значения СВ для которых равны -му баллу, обозначим через соответственно. Требуется, чтобы было и . Тогда

1. Вычисляется коэффициент по формуле

.

5. Задаются значением доверительной вероятности и по таблице 3 находят значение коэффициента .

6. Если , то делается вывод, «выборки и различны с доверительной вероятностью ».

 

Таблица 3 – Критические значения критерия «хи-квадрат»

 

L Доверительная вероятность
0,5% 1% 2,50% 5% 10% 25% 50% 75% 90% 95% 97,5% 99% 99,5%
0,00004 0,00016 0,00098 0,00393 0,02 0,10 0,45 1,32 2,71 3,84 5,02 6,63 7,88
0,01003 0,0201 0,05064 0,10259 0,21 0,58 1,39 2,77 4,61 5,99 7,38 9,21 10,60
0,07172 0,11483 0,2158 0,35185 0,58 1,21 2,37 4,11 6,25 7,81 9,35 11,34 12,84
0,20699 0,29711 0,48442 0,71072 1,06 1,92 3,36 5,39 7,78 9,49 11,14 13,28 14,86
6,00 0,41 0,55 0,83 1,15 1,61 2,67 4,35 6,63 9,24 11,07 12,83 15,09 16,75
7,00 0,68 0,87 1,24 1,64 2,20 3,45 5,35 7,84 10,64 12,59 14,45 16,81 18,55
8,00 0,99 1,24 1,69 2,17 2,83 4,25 6,35 9,04 12,02 14,07 16,01 18,48 20,28
9,00 1,34 1,65 2,18 2,73 3,49 5,07 7,34 10,22 13,36 15,51 17,53 20,09 21,95
10,00 1,73 2,09 2,70 3,33 4,17 5,90 8,34 11,39 14,68 16,92 19,02 21,67 23,59
11,00 2,16 2,56 3,25 3,94 4,87 6,74 9,34 12,55 15,99 18,31 20,48 23,21 25,19
12,00 2,60 3,05 3,82 4,57 5,58 7,58 10,34 13,70 17,28 19,68 21,92 24,72 26,76
13,00 3,07 3,57 4,40 5,23 6,30 8,44 11,34 14,85 18,55 21,03 23,34 26,22 28,30
14,00 3,57 4,11 5,01 5,89 7,04 9,30 12,34 15,98 19,81 22,36 24,74 27,69 29,82
15,00 4,07 4,66 5,63 6,57 7,79 10,17 13,34 17,12 21,06 23,68 26,12 29,14 31,32
16,00 4,60 5,23 6,26 7,26 8,55 11,04 14,34 18,25 22,31 25,00 27,49 30,58 32,80
17,00 5,14 5,81 6,91 7,96 9,31 11,91 15,34 19,37 23,54 26,30 28,85 32,00 34,27
18,00 5,70 6,41 7,56 8,67 10,09 12,79 16,34 20,49 24,77 27,59 30,19 33,41 35,72
19,00 6,26 7,01 8,23 9,39 10,86 13,68 17,34 21,60 25,99 28,87 31,53 34,81 37,16
20,00 6,84 7,63 8,91 10,12 11,65 14,56 18,34 22,72 27,20 30,14 32,85 36,19 38,58
21,00 7,43 8,26 9,59 10,85 12,44 15,45 19,34 23,83 28,41 31,41 34,17 37,57 40,00
22,00 8,03 8,90 10,28 11,59 13,24 16,34 20,34 24,93 29,62 32,67 35,48 38,93 41,40
23,00 8,64 9,54 10,98 12,34 14,04 17,24 21,34 26,04 30,81 33,92 36,78 40,29 42,80
24,00 9,26 10,20 11,69 13,09 14,85 18,14 22,34 27,14 32,01 35,17 38,08 41,64 44,18
25,00 9,89 10,86 12,40 13,85 15,66 19,04 23,34 28,24 33,20 36,42 39,36 42,98 45,56
26,00 10,52 11,52 13,12 14,61 16,47 19,94 24,34 29,34 34,38 37,65 40,65 44,31 46,93
27,00 11,16 12,20 13,84 15,38 17,29 20,84 25,34 30,43 35,56 38,89 41,92 45,64 48,29
28,00 11,81 12,88 14,57 16,15 18,11 21,75 26,34 31,53 36,74 40,11 43,19 46,96 49,64
29,00 12,46 13,56 15,31 16,93 18,94 22,66 27,34 32,62 37,92 41,34 44,46 48,28 50,99
30,00 13,12 14,26 16,05 17,71 19,77 23,57 28,34 33,71 39,09 42,56 45,72 49,59 52,34

 

Проверка по критерию Фишера (для двухуровневых шкал).

 

Критерий применяется в случаях, когда выборки анализируются на предмет наличия в их элементах некоторого признака. Обозначим через количество элементов, обладающих этим признаком, и общее количество элементов в каждой из сравниваемых выборок.

1. Вычисляется коэффициент Фишера по формуле

.

2. Если , делается вывод, что выборки различны с доверительной вероятностью 0,95.

– Конец работы –

Эта тема принадлежит разделу:

МЕТОДЫ АНАЛИЗА ДАННЫХ

для выполнения исследований на младших курсах ФИСТ... С А Пиявский Несколько основных понятий математической статистики Сразу оговоримся что...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Оценка различия двух выборок

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Несколько основных понятий математической статистики
  Сразу оговоримся, что материал излагается в упрощенной терминологии и применительно к достаточно узкой сфере возможностей математической статистики, достаточной для выполнения иссле

Гистограмма
Поскольку об объектах генеральной совокупности не известно ничего, кроме значений, которые принимает на каждом из них случайная величина, генеральная совокупность полностью характеризуется совокупн

Закон (плотность) распределения случайной величины
  Итак, увеличение количества объектов в выборке практически не меняет вида гистограммы. Однако, если СВ является вещественным числом, то-есть может принимать любые вещественные значе

Нормальный закон распределения
Удивительно, что для большинства генеральных совокупностей, имеющих совершенно разную природу, закон распределения примерно одинаков и отличается только двумя числовыми величинами. Этот закон распр

Функция Лапласа
Поскольку нормальное распределение широко распространено, рассчитаны таблицы значений нескольких связанных с ним функций. Одной из них является функция Лапласа

Основные числовые характеристики выборки
  К ним относятся · наибольшее и наименьшее значение СВ, · мода – значение СВ, которому отвечает максимальное значение плотности распределения, · медиана –

Расчет необходимого объема выборки для получения достоверных суждений о генеральной совокупности
  Степень достоверности суждений о генеральной совокупности на основе наблюдений за ограниченной выборкой будем характеризовать возможной ошибкой в оценке среднего значения СВ для все

Проверка нормальности закона распределения случайной величины
  Для проверки того, что по данным конкретной выборки СВ распределена по нормальному закону, следует убедиться, что высказывание «Исходная выборка и «эталонная» выборка с таким же кол

Выявление грубых ошибок
1. Задаются доверительной вероятностью и по рисунку 1 для

Анализ степени взаимовлияния двух случайных величин
Взаимовлияние измеряется с помощью коэффициента корреляции Пирсона

Простая регрессия
  В простой линейной регрессии предполагается, что зависимая переменная является линей

Множественная регрессия
Множественная регрессия – это аппроксимация зависимости СВ от нескольких независимых переменных величин. Исходными данными является набор векторов

Выделение наиболее значимых независимых переменных и их комплексов
  Для того, чтобы определить, какая из независимых переменных или их группа наиболее существенно влияет на зависимую переменную при построении множественной регрессии, нужно в модели,

Кластеризация множества объектов
  Кластеризация – это разбиение множества объектов, между которыми установлено отношение близости (расстояние), на группы наиболее близких между собой объектов. В каждой группе выделя

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги