Требуется построить гистограмму и полигон относительных частот для известного группированного вариационного ряда. На их основе выдвинуть нулевую гипотезу о виде распределения генеральной совокупности. В данном случае это нормальное распределение. На одном чертеже с гистограммой построить график теоретической плотности вероятностей. Сделать вывод об их визуальном совпадении.
Для удобства заполним таблицу. В таблицу занесены середины интервалов , в четвертый – относительные частоты интервалов , в пятый – высоты прямоугольников гистограммы относительных частот . Таблица 3
Индекс | Интервал | Середина интервала | Относит. частота | Высота прямоуг. | |
-3,35 | 0,02 | 0,016502 | |||
-2,05 | 0,02 | 0,016502 | |||
-0,75 | 0,03 | 0,024752 | |||
0,55 | 0,05 | 0,041254 | |||
1,85 | 0,23 | 0,189769 | |||
3,15 | 0,27 | 0,222772 | |||
4,45 | 0,17 | 0,140264 | |||
5,75 | 0,13 | 0,107261 | |||
7,05 | 0,06 | 0,049505 | |||
8,35 | 0,02 | 0,016502 | |||
3,2046 | 0,825083 | ||||
По данным таблицы построим гистограмму. Для этого в прямоугольной системе координат на оси абсцисс откладываем значения границ интервалов разбиения и на каждом из интервалов с номером строим прямоугольник с высотой .
Для такой гистограммы площадь ступенчатой фигуры соответствует сумме вероятностей и равна . Площадь каждого прямоугольника гистограммы равна вероятности попадания случайной величины в интервал, соответствующий основанию прямоугольника
Рис.3. Гистограмма относительных частот и кривая теоритической плотности вероятностей
Полигон относительных частот – ломаная, соединяющая точки ,
Гистограмма и полигон относительных частот, являющиеся статистическими оценками плотности вероятностей генеральной совокупности, схожи с кривой плотности вероятностей нормального закона. На основании этого выдвигаем нулевую гипотезу : Генеральная совокупность, из которой взята выборка, распределена по нормальному закону с параметрами , , то есть теоретическая плотность вероятностей имеет вид:
Рис.4 Полигон относительных частот
Вычислим значения теоретической плотности вероятностей в точках – середины интервалов по таблице П 2 Приложения. Результаты вычислений занесем в таблицу. Заметим, что .
Таблица 4
-3,35 | -2,882540414 | 0,006260733 | 0,002753 | |
-2,05 | -2,31083466 | 0,02762824 | 0,01215 | |
-0,75 | -1,739128905 | 0,08792922 | 0,038669 | |
0,55 | -1,167423151 | 0,201820451 | 0,088755 | |
1,85 | -0,595717396 | 0,334078916 | 0,146919 | |
3,15 | -0,024011642 | 0,398827332 | 0,175394 | |
4,45 | 0,547694113 | 0,343378188 | 0,151009 | |
5,75 | 1,119399867 | 0,213212393 | 0,093765 | |
7,05 | 1,691105622 | 0,09547818 | 0,041989 | |
8,35 | 2,262811376 | 0,030835271 | 0,013561 | |
3,2046 | 0,0000 | 0,398942322 | 0,175444 |
ЭМПИРИЧЕСКАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ
Пусть – выборка объема , содержащая различных вариант, из генеральной совокупности случайной величины , имеющая функцию распределения , .
Неизвестную функцию распределения генеральной совокупности называют теоретической функцией распределения.
Эмпирической функцией распределения группированной выборки называется функция , определяющая для любого относительную частоту события , то есть , где – середины интервалов группировки; – относительные частоты тех интервалов, середины которых меньше .
По определению зависит от выборки и обладает свойствами функции распределения случайной величины. В частности :
1. неубывающая функция;
2. непрерывная слева;
3. имеет значения, принадлежащие отрезку ;
4. при , а при .
Различие между эмпирической и теоретической функциями состоит в том, что теоретическая функция определяет вероятность события , а эмпирическая функция определяет относительную частоту этого же события, найденную по данной выборке.
Значение эмпирической функции распределения для статистики определяется следующим утверждением.
Теорема (Гливенко): Пусть – эмпирическая функция распределения, построенная по выборке объема из генеральной совокупности с функцией распределения . Тогда для любого и
.
Таким образом, при каждом сходится по вероятности к и, следовательно, при большом объеме выборки может служить приближенным значением (оценкой) функции распределения генеральной совокупности в каждой точке .
Обычно эмпирическую функцию распределения группированной выборки записывают в виде:
,
где – накопленные относительные частоты (таблица 4).
График эмпирической функции распределения имеет ступенчатый вид
Требуется составить эмпирическую функцию распределения группированной выборки и построить ее график. На одном чертеже с эмпирической функцией распределения построить график теоретической функции распределения. Сделать вывод об их визуальном совпадении.
Взяв значения накопленных относительных частот и значения середин интервалов, составим эмпирическую функцию распределения и построим ее график.
Согласно выдвинутой гипотезе о виде распределения генеральной совокупности, теоретическая функция распределения генеральной совокупности является функция распределения нормального закона:
,
где – функция Лапласа. Здесь, как и ранее,
, ,
На одном чертеже с эмпирической функцией распределения построим график теоретической функции распределения. Для этого найдем значения теоретической функции распределения в точках . Для удобства вычислений значений теоретической функции распределения заполним таблицу
Значения функции Лапласа , по которой вычисляются значения функции распределения , приведены в таблице П 1 Приложения.