Оценка различия двух выборок

Чтобы убедиться, что две выборки действительно различны с точки зрения значений одной и той же СВ, можно использовать три критерия:

· Крамера-Уэлча, если элементы этих выборок не связаны между собой,

· Вилкоксона-Манна-Уитни, если есть возможность попарно сравнивать между собой элементы этих выборок,

· «хи-квадрат», если СВ измеряется не в непрерывной, а в порядковой шкале (например, балльной)

 

При этом объемы выборок должны быть не менее 10.

 

Проверка по критерию Крамера-Уэлча.

1. Для выборок и с объемами и вычисляются математические ожидания и средние квадратичные отклонения /

2. Вычисляется значение коэффициента по формуле

.

3. Задаются значением доверительной вероятности и по рисунку 5 находят значение коэффициента Стьюдента при .

4. Если , то делается вывод, «выборки и различны с доверительной вероятностью ».

 

Проверка по критерию Вилкоксона-Манна-Уитни.

 

1. Для каждого элемента первой выборки подсчитывается коэффициент, равный количеству элементов второй выборки, у которых значение СВ больше, чем у данного элемента первой выборки. К этому коэффициенту добавляется число, равное половинному количеству элементов второй выборки, у которых значение СВ совпадает со значением СВ для данного элемента первой выборки. Рассчитанные таким образом коэффициенты для всех элементов первой выборки суммируются. Их сумму обозначим через .

2. Рассчитывается коэффициент по формуле

.

3. Задаются значением доверительной вероятности и по рисунку 5 находят значение коэффициента Стьюдента при .

4. Если , то делается вывод, «выборки и различны с доверительной вероятностью ».

 

Проверка по критерию «хи-квадрат».

 

Пусть СВ измеряется в порядковой шкале с различными баллами. Количества объектов в выборках и , значения СВ для которых равны -му баллу, обозначим через соответственно. Требуется, чтобы было и . Тогда

1. Вычисляется коэффициент по формуле

.

5. Задаются значением доверительной вероятности и по таблице 3 находят значение коэффициента .

6. Если , то делается вывод, «выборки и различны с доверительной вероятностью ».

 

Таблица 3 – Критические значения критерия «хи-квадрат»

 

L Доверительная вероятность
0,5% 1% 2,50% 5% 10% 25% 50% 75% 90% 95% 97,5% 99% 99,5%
0,00004 0,00016 0,00098 0,00393 0,02 0,10 0,45 1,32 2,71 3,84 5,02 6,63 7,88
0,01003 0,0201 0,05064 0,10259 0,21 0,58 1,39 2,77 4,61 5,99 7,38 9,21 10,60
0,07172 0,11483 0,2158 0,35185 0,58 1,21 2,37 4,11 6,25 7,81 9,35 11,34 12,84
0,20699 0,29711 0,48442 0,71072 1,06 1,92 3,36 5,39 7,78 9,49 11,14 13,28 14,86
6,00 0,41 0,55 0,83 1,15 1,61 2,67 4,35 6,63 9,24 11,07 12,83 15,09 16,75
7,00 0,68 0,87 1,24 1,64 2,20 3,45 5,35 7,84 10,64 12,59 14,45 16,81 18,55
8,00 0,99 1,24 1,69 2,17 2,83 4,25 6,35 9,04 12,02 14,07 16,01 18,48 20,28
9,00 1,34 1,65 2,18 2,73 3,49 5,07 7,34 10,22 13,36 15,51 17,53 20,09 21,95
10,00 1,73 2,09 2,70 3,33 4,17 5,90 8,34 11,39 14,68 16,92 19,02 21,67 23,59
11,00 2,16 2,56 3,25 3,94 4,87 6,74 9,34 12,55 15,99 18,31 20,48 23,21 25,19
12,00 2,60 3,05 3,82 4,57 5,58 7,58 10,34 13,70 17,28 19,68 21,92 24,72 26,76
13,00 3,07 3,57 4,40 5,23 6,30 8,44 11,34 14,85 18,55 21,03 23,34 26,22 28,30
14,00 3,57 4,11 5,01 5,89 7,04 9,30 12,34 15,98 19,81 22,36 24,74 27,69 29,82
15,00 4,07 4,66 5,63 6,57 7,79 10,17 13,34 17,12 21,06 23,68 26,12 29,14 31,32
16,00 4,60 5,23 6,26 7,26 8,55 11,04 14,34 18,25 22,31 25,00 27,49 30,58 32,80
17,00 5,14 5,81 6,91 7,96 9,31 11,91 15,34 19,37 23,54 26,30 28,85 32,00 34,27
18,00 5,70 6,41 7,56 8,67 10,09 12,79 16,34 20,49 24,77 27,59 30,19 33,41 35,72
19,00 6,26 7,01 8,23 9,39 10,86 13,68 17,34 21,60 25,99 28,87 31,53 34,81 37,16
20,00 6,84 7,63 8,91 10,12 11,65 14,56 18,34 22,72 27,20 30,14 32,85 36,19 38,58
21,00 7,43 8,26 9,59 10,85 12,44 15,45 19,34 23,83 28,41 31,41 34,17 37,57 40,00
22,00 8,03 8,90 10,28 11,59 13,24 16,34 20,34 24,93 29,62 32,67 35,48 38,93 41,40
23,00 8,64 9,54 10,98 12,34 14,04 17,24 21,34 26,04 30,81 33,92 36,78 40,29 42,80
24,00 9,26 10,20 11,69 13,09 14,85 18,14 22,34 27,14 32,01 35,17 38,08 41,64 44,18
25,00 9,89 10,86 12,40 13,85 15,66 19,04 23,34 28,24 33,20 36,42 39,36 42,98 45,56
26,00 10,52 11,52 13,12 14,61 16,47 19,94 24,34 29,34 34,38 37,65 40,65 44,31 46,93
27,00 11,16 12,20 13,84 15,38 17,29 20,84 25,34 30,43 35,56 38,89 41,92 45,64 48,29
28,00 11,81 12,88 14,57 16,15 18,11 21,75 26,34 31,53 36,74 40,11 43,19 46,96 49,64
29,00 12,46 13,56 15,31 16,93 18,94 22,66 27,34 32,62 37,92 41,34 44,46 48,28 50,99
30,00 13,12 14,26 16,05 17,71 19,77 23,57 28,34 33,71 39,09 42,56 45,72 49,59 52,34

 

Проверка по критерию Фишера (для двухуровневых шкал).

 

Критерий применяется в случаях, когда выборки анализируются на предмет наличия в их элементах некоторого признака. Обозначим через количество элементов, обладающих этим признаком, и общее количество элементов в каждой из сравниваемых выборок.

1. Вычисляется коэффициент Фишера по формуле

.

2. Если , делается вывод, что выборки различны с доверительной вероятностью 0,95.