Виды гистограмм

 

Требуется построить гистограмму и полигон относительных частот для известного группированного вариационного ряда. На их основе выдвинуть нулевую гипотезу о виде распределения генеральной совокупности. В данном случае это нормальное распределение. На одном чертеже с гистограммой построить график теоретической плотности вероятностей. Сделать вывод об их визуальном совпадении.

Для удобства заполним таблицу. В таблицу занесены середины интервалов , в четвертый – относительные частоты интервалов , в пятый – высоты прямоугольников гистограммы относительных частот . Таблица 3

Индекс Интервал Середина интервала Относит. частота Высота прямоуг.
-3,35 0,02 0,016502
-2,05 0,02 0,016502
-0,75 0,03 0,024752
0,55 0,05 0,041254
1,85 0,23 0,189769
3,15 0,27 0,222772
4,45 0,17 0,140264
5,75 0,13 0,107261
7,05 0,06 0,049505
8,35 0,02 0,016502
    3,2046 0,825083
           

 

По данным таблицы построим гистограмму. Для этого в прямоугольной системе координат на оси абсцисс откладываем значения границ интервалов разбиения и на каждом из интервалов с номером строим прямоугольник с высотой .

Для такой гистограммы площадь ступенчатой фигуры соответствует сумме вероятностей и равна . Площадь каждого прямоугольника гистограммы равна вероятности попадания случайной величины в интервал, соответствующий основанию прямоугольника

 

Рис.3. Гистограмма относительных частот и кривая теоритической плотности вероятностей

 

Полигон относительных частот – ломаная, соединяющая точки ,

Гистограмма и полигон относительных частот, являющиеся статистическими оценками плотности вероятностей генеральной совокупности, схожи с кривой плотности вероятностей нормального закона. На основании этого выдвигаем нулевую гипотезу : Генеральная совокупность, из которой взята выборка, распределена по нормальному закону с параметрами , , то есть теоретическая плотность вероятностей имеет вид:

 

Рис.4 Полигон относительных частот

Вычислим значения теоретической плотности вероятностей в точках – середины интервалов по таблице П 2 Приложения. Результаты вычислений занесем в таблицу. Заметим, что .

Таблица 4

-3,35 -2,882540414 0,006260733 0,002753
-2,05 -2,31083466 0,02762824 0,01215
-0,75 -1,739128905 0,08792922 0,038669
0,55 -1,167423151 0,201820451 0,088755
1,85 -0,595717396 0,334078916 0,146919
3,15 -0,024011642 0,398827332 0,175394
4,45 0,547694113 0,343378188 0,151009
5,75 1,119399867 0,213212393 0,093765
7,05 1,691105622 0,09547818 0,041989
8,35 2,262811376 0,030835271 0,013561
  3,2046 0,0000 0,398942322 0,175444

 

 

ЭМПИРИЧЕСКАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ

Пусть – выборка объема , содержащая различных вариант, из генеральной совокупности случайной величины , имеющая функцию распределения , .

Неизвестную функцию распределения генеральной совокупности называют теоретической функцией распределения.

Эмпирической функцией распределения группированной выборки называется функция , определяющая для любого относительную частоту события , то есть , где – середины интервалов группировки; – относительные частоты тех интервалов, середины которых меньше .

По определению зависит от выборки и обладает свойствами функции распределения случайной величины. В частности :

1. неубывающая функция;

2. непрерывная слева;

3. имеет значения, принадлежащие отрезку ;

4. при , а при .

Различие между эмпирической и теоретической функциями состоит в том, что теоретическая функция определяет вероятность события , а эмпирическая функция определяет относительную частоту этого же события, найденную по данной выборке.

Значение эмпирической функции распределения для статистики определяется следующим утверждением.

Теорема (Гливенко): Пусть – эмпирическая функция распределения, построенная по выборке объема из генеральной совокупности с функцией распределения . Тогда для любого и

.

Таким образом, при каждом сходится по вероятности к и, следовательно, при большом объеме выборки может служить приближенным значением (оценкой) функции распределения генеральной совокупности в каждой точке .

Обычно эмпирическую функцию распределения группированной выборки записывают в виде:

,

где – накопленные относительные частоты (таблица 4).

График эмпирической функции распределения имеет ступенчатый вид

 

 
 

Рис. 5 Эмпирическая функция распределения

 

 

Требуется составить эмпирическую функцию распределения группированной выборки и построить ее график. На одном чертеже с эмпирической функцией распределения построить график теоретической функции распределения. Сделать вывод об их визуальном совпадении.

Взяв значения накопленных относительных частот и значения середин интервалов, составим эмпирическую функцию распределения и построим ее график.

 

Согласно выдвинутой гипотезе о виде распределения генеральной совокупности, теоретическая функция распределения генеральной совокупности является функция распределения нормального закона:

,

где – функция Лапласа. Здесь, как и ранее,

, ,

 

 

 

На одном чертеже с эмпирической функцией распределения построим график теоретической функции распределения. Для этого найдем значения теоретической функции распределения в точках . Для удобства вычислений значений теоретической функции распределения заполним таблицу

 

 

Значения функции Лапласа , по которой вычисляются значения функции распределения , приведены в таблице П 1 Приложения.