Математическая статистика разрабатывает способы сбора, группировки и анализа статистических данных, т.е. сведений, получаемых в результате наблюдения некоторой изучаемой случайной величины. При изучении случайной величины обычно имеют дело с совокупностью предметов, подлежащих обследованию относительно некоторого количественного признака Х. Совокупность предметов, подлежащих обследованию называется генеральной совокупностью, число предметов в генеральной совокупности называют объемом генеральной совокупности. Если обследование всей генеральной совокупности невозможно (объем ее слишком велик или даже равен бесконечности, или обследование предмета связано с его уничтожением), то обследуется только часть генеральной совокупности, которая называется выборочной совокупностью или выборкой. Число предметов в выборке называют объемом выборки. Виды и способы отбора могут быть весьма различными, важно только, чтобы выборка хорошо представляла генеральную совокупность, т.е. была репрезентативной (представительной).
Значение признака Х в выборочной совокупности называются вариантами. Пусть значение признака Х равное x1 встретилось в выборке n1 раз, x2 встретилось в выборке n2 раз, … , xk встретилось в выборке nk раз. Числа
называются частотами, объем выборки равен
(34) |
числа
(35) |
относительными частотами. Соответствие между вариантами и частотами или между вариантами и относительными частотами называется вариационным рядом. Вариационный ряд записывают обычно в виде таблицы:
Таблица 6
xi | x1 | x2 | … | xj | … | xk |
ni | n1 | n2 | … | nj | … | nk |
Задачей математической статистики является оценка неизвестных параметров распределения с.в. (приближенное определение неизвестной функции распределения, оценка неизвестного математического ожидания и дисперсии, определение зависимости между двумя с.в., проверка статистических гипотез и т.д.).
Определение. Эмпирической функцией распределения (или функцией распределения выборки) называют функцию F(x), определяющую для каждого значения относительную частоту события X<x:
(36) |
где число вариант, для которых объем выборки.
Пример 28. Данные по продаже 100 пар мужской обуви в некотором магазине представлены следующим вариационным рядом
Размер () | |||||||
Число проданных пар () | |||||||
Относительная частота () | 0.02 | 0.08 | 0.12 | 0.25 | 0.28 | 0.17 | 0.08 |
Построить эмпирическую функцию распределения.
Решение.
1. тогда значит F(x)=0; | 2. F(x)=0.02; |
3. F(x)=0.1; | 4. F(x)=0.22; |
5. F(x)=0.47; | 6. F(x)=0.75; |
7. F(x)=0.92; | 8. F(x)=1. |