Медианой (Ме) называется такое значение признака X, когда ровно половина значений экспериментальных данных меньше ее, а вторая половина — больше.
Если данных немного (объем выборки невелик), медиана вычисляется очень просто. Для этого выборку ранжируют, т. е. располагают данные в порядке возрастания или убывания, и в ранжированной выборке, содержащей n членов, ранг R (порядковый номер) медианы определяется как
Пример 7.8. Имеется ранжированная выборка, содержащая нечетное число членов n = 9:
12, 14, 14, 18, 20, 22, 22, 26, 28.
Тогда ранг медианы:
и медиана совпадает с пятым членом ряда: Ме = 20.
Если выборка содержит четное число членов, то медиана не может быть определена столь однозначно.
Пример 7.9. Имеется ранжированная выборка, содержащая 10 членов:
6, 8, 10, 12, 14, 16, 18, 20, 22, 24.
Ранг медианы оказывается равным:
Медианой в этом случае может быть любое число между 14 и 16 (5-м и 6-м членами ряда). Для определенности принято считать в качестве медианы среднее арифметическое этих значений, т. е.:
Если необходимо найти медиану для сгруппированных данных, то поступают следующим образом. Вначале находят интервал группировки, в котором содержится медиана, путем подсчета накопленных частот или накопленных относительных частот.
Медианным будет тот интервал, в котором накопленная частота впервые окажется больше или накопленная относительная частота — больше 0,5. Внутри медианного интервала медиана определяется по следующей формуле:
где — нижняя граница медианного интервала;
hme — ширина медианного интервала;
— накопленная частота интервала, предшествующего медианному,
— частота медианного интервала.
Пример 7.10. Найти медиану для интервального ряда примера 6.3.
Превышение разрешенной скорости движения (км/ч) | 20 – 30 | 30 – 40 | 40 – 50 | 50 – 60 | больше 60 |
Количество нарушений |
Объем выборки равен п = 50 + 32 + 26 + 11 + 5 = 124.
Найдем медианный интервал – интервал, в котором накопленная частота впервые окажется больше или накопленная относительная частота — больше 0,5.
Так как, накопительная частота второго интервала 50 + 32 = 82 > 62, то следовательно интервал (30; 40) будет медианным и = 30, hme = 40 – 30 = 10, = 50, = 32.
Значит,
Медиана обычно несколько отличается от среднего арифметического. Так бывает всегда, когда имеет место несимметричная форма эмпирического распределения.