Медиана

Медианой (Ме) называется такое значение признака X, когда ровно половина значений экспериментальных данных меньше ее, а вторая половина — больше.

Если данных немного (объем выборки невелик), медиана вычисляется очень просто. Для этого выборку ранжируют, т. е. располагают данные в порядке возрастания или убывания, и в ранжированной выборке, содержащей n членов, ранг R (порядковый номер) медианы определяется как

Пример 7.8. Имеется ранжированная выборка, содержащая нечетное число членов n = 9:

12, 14, 14, 18, 20, 22, 22, 26, 28.

Тогда ранг медианы:

и медиана совпадает с пятым членом ряда: Ме = 20.

Если выборка содержит четное число членов, то медиана не может быть определена столь однозначно.

Пример 7.9. Имеется ранжированная выборка, содержащая 10 членов:

6, 8, 10, 12, 14, 16, 18, 20, 22, 24.

Ранг медианы оказывается равным:

Медианой в этом случае может быть любое число между 14 и 16 (5-м и 6-м членами ряда). Для определенности принято считать в качестве медианы среднее арифметическое этих значений, т. е.:

Если необходимо найти медиану для сгруппированных данных, то поступают следующим образом. Вначале находят интервал группировки, в котором содержится медиана, путем подсчета накопленных частот или накопленных относительных частот.

Медианным будет тот интервал, в котором накопленная частота впервые окажется больше или накопленная относительная частота — больше 0,5. Внутри медианного интервала медиана определяется по следующей формуле:

где — нижняя граница медианного интервала;

hme — ширина медианного интервала;

— накопленная частота интервала, предшествующего медианному,

— частота медианного интервала.

Пример 7.10. Найти медиану для интервального ряда примера 6.3.

Превышение разрешенной скорости движения (км/ч) 20 – 30 30 – 40 40 – 50 50 – 60 больше 60
Количество нарушений

Объем выборки равен п = 50 + 32 + 26 + 11 + 5 = 124.

Найдем медианный интервал – интервал, в котором накопленная частота впервые окажется больше или накопленная относительная частота — больше 0,5.

Так как, накопительная частота второго интервала 50 + 32 = 82 > 62, то следовательно интервал (30; 40) будет медианным и = 30, hme = 40 – 30 = 10, = 50, = 32.

Значит,

Медиана обычно несколько отличается от среднего арифметического. Так бывает всегда, когда имеет место несимметричная форма эмпирического распределения.