Числовые характеристики статистического распределения

Для выборки можно определить ряд числовых характеристик, ана­логичным тем, что в теории вероятностей определялись для случайных величин (см. п. 2.5).

Пусть статистическое распределение выборки объема n имеет вид:

xi x1 x2 x3 xk
ni n1 n2 n3 nk

(6.3)

 

Выборочным средним называется среднее арифметическое всех значений выборки:

(6.4)

 

Выборочное среднее можно записать и так:

(6.5)

где p*i =— частость. Для обозначения выборочного среднего иcпользуют следующие символы: , М*(Х), m*х.

Отметим, что в случае интервального статистического ряда в равенстве (6.4) в качестве xi берут середины его интервалов, a ni — соответствующие им частоты.

Выборочной дисперсией DB называется среднее арифметическое квадратов отклонений значений выборки от выборочной средней т.е.

(6.6)

или, что то же самое,

(6.7)

Можно показать, что DB может быть подсчитана также по формуле

, то есть (6.8)

здесь .

Выборочное среднее квадратическое отклонение выборки определяется формулой

(6.9)

Особенность выборочного с. к. о. (sв) состоит в том, что оно измеряется в тех же единицах, что и изучаемый признак.

При решении практических задач используется и величина

(6.10)

(6.11)

которая называется исправленной выборочной дисперсией (см. далее п. 7.1).

Величина

(6.12)

называется исправленным выборочным средним квадратическим отклонением.

Для непрерывно распределенного признака формулы для выбо­рочных средних будут такими же, но за значения х1, х2,…, хk надо брать не концы промежутков [х0, х1), [х1, х2), …, а их середины

В качестве описательных характеристик вариационного ряда, x(1)

x(2), … , x(n) (или полученного из него статистического распределения выборки (6.3)) используется медиана, мода, размах вариации (выбор­ки) и т.д.

Размахом вариации называется число R = x(n) — x(1),где x(1) =, x(n)= или R = xmax—xmin, где xmах — наибольший, xmin — наименьший вариант ряда.

Модой М0* вариационного ряда называется вариант, имеющий наи­большую частоту.

Медианой Мe* вариационного ряда называется значение признака (св. X), приходящееся на середину ряда.

Если п = 2k (т. е. ряд x(1), x(2),…, x(k), x(k+1),..., x(2k), имеет четное число членов), то Мe* =; если п = 2к + 1, то Мe* = x(k+1)

Пример 6.7.По условию примера 6.2 из п. 6.3 найти характеристики выборки — результаты тестирования 10 абитуриентов.

Используя формулы (6.4)-(6.12) и определения из п. 6.5, находим: (0 • 1 + 1 • 2 + ... + 5 • 3) = 3,

DB = ((0 - 3)2 • 1 + (1 - 3)2 • 2 + ... + (5 - 3)2 • 3) = 3.2,

sB = 1.79,

S2 = • 3,2≈3.56.

S = 1,87, R = 5 -0 = 5, М0* = 5,

Мe*==3.5.