Пусть из генеральной совокупности извлечена выборка, причем значение исследуемого параметра наблюдалось раз, - раз и т.д. При этом
объем выборки. Наблюдаемые значения называют вариантами, а последовательность вариант, записанных в возрастающем порядке – вариационным рядом. Числа наблюдений называют частотами,а их отношения к объему выборки - относительными частотами. Вариационный рядможно представить таблицей вида
X | ….. | |||
n | …. |
Статистическим распределением выборкиназывают перечень вариант и соответствующих им относительных частот. Статистическое распределение можно представить как
X | ….. | |||
w | …. |
где относительные частоты .
Заметим, что в теории вероятностей под распределением понимают соответствие между возможными значениями случайной величины и их вероятностями, а в математической статистике – соответствие между наблюдаемыми вариантами и их частотами или относительными частотами.
Приведенный способ представления статистических данных применяют в случае дискретных случайных величин. Для непрерывных случайных величин удобнее разбить отрезок [a,b] возможных значений случайной величины на частичные полуинтервалы (замкнут также и справа) с помощью некоторой системы точек . Часто разбиение [a,b] производят на равные части, тогда
где
В качестве частот теперь надо брать количество наблюдаемых значений, попавших на каждый из частичных интервалов . Вариационный ряд имеет в таком случае вид
X | ….. | |||
n | …. |
а статистическое распределение –
X | ….. | |||
n | …. |
Число интервалов часто выбирают на основании формулы Стерджерса
.