Задача 2.

Для выборки, извлеченной из генеральной совокупности и представленной интервальным рядом (в первой строке указаны интервалы значений исследуемого количественного признака X генеральной совокупности; во второй – частоты , т.е. количество элементов выборки, значения признака которых принадлежат указанному интервалу), требуется:

1) Построить полигон относительных накопленных частот (кумулятивную кривую);

2) Построить гистограмму частот и гистограмму относительных частот;

3) Найти выборочную среднюю, выборочную дисперсию, моду и медиану;

4) Проверить на уровне значимости гипотезу о нормальном распределении признака генеральной совокупности по критерию согласия Пирсона;

5) В случае согласованности с нормальным распределением найти с надежностью доверительные интервалы для оценки математического ожидания и среднего квадратического отклонения признака генеральной совокупности.

 

2.0.

3-5 5-7 7-9 9-11 11-13 13-15 15-17

 

.

В нашем случае n=2750.Тогда на основе данной таблицы построим интервальный статистический и интервальный выборочный ряды распределения, сведенные в одну таблицу.

i
3-5 5-7 7-9 9-11 11-13 13-15 15-17
0,0036 0,0255 0,1636 0,3527 0,3127 0,12 0,0218
0,0036 0,0291 0,1927 0,5454 0,8581 0,9781

 

 
 

Построим полигон относительных накопленных частот (кумулятивную кривую);

 

 

Построим гистограмму частот.

В нашем случае исследуемый признак X может принимать значения на отрезке [3;17]. Интервальная группировка выполнена таким образом, что длина каждого интервала равна h=2. Площадь прямоугольника, построенного на i-ом интервале, должна равняться . Это значит, что высота i-го прямоугольника будет .

На остальных интервалах прямоугольники строятся аналогично.

Если высоту i-го прямоугольника определим как , то получим гистограмму относительных частот, которую можно рассматривать как аналог дифференциальной функции распределения в теории вероятностей.

Для того, чтобы найти выборочную среднюю, воспользуемся формулой

, где k - количество интервалов, n - объем выборки.

.

Для вычисления выборочной дисперсии воспользуемся формулой . В случае интервальной группировки находится по формуле

=.

Теперьможно окончательно вычислитьвыборочную дисперсию

.

Найдем выборочное среднее квадратическое отклонение

.

 

Отыщем выборочный коэффициент вариации

.

Найденное значение выборочного коэффициента вариации дает наглядное представление о степени относительного рассеяния исследуемого признака.

Отыщем значения "исправленной" дисперсии и "исправленного" среднего квадратического отклонения , .

Для отыскания моды в случае интервальной группировки используем формулу , где - левая граница интервала, имеющего наибольшую интервальную частоту, h - шаг (длина интервала группировки), , R - размах выборки, k - количество интервалов, - наибольшая интервальная частота, - интервальная частота интервала, расположенного слева от интервала с наибольшей интервальной частотой, - интервальная частота интервала, расположенного справа от интервала с наибольшей интервальной частотой.

В нашем случае .

Значение медианы для случая интервальной группировки отыщем по формуле , где - левая граница интервала, содержащего медиану, n - объем выборки, h - шаг, - интервальная частота интервала, содержащего медиану, - интервальные частоты всех интервалов, расположенных слева от интервала, содержащего медиану.

Найдем значение медианы для нашей конкретной задачи .

Далее начнем суммировать интервальные частоты слева направо до тех пор пока сумма интервальных частот не превзойдет .Номер последней прибавленной частоты будет совпадать с номером интервала, содержащего медиану распределения: 10+70+450+970=1500>1375. Следовательно, =9, .

Проверим на уровне значимости a=0,05 гипотезу о нормальном распределении признака x генеральной совокупности по критерию согласия Пирсона.

Для нашей задачи все условия применимости метода Пирсона выполняются: , для любого интервала .

Проверка гипотезы нормальности по критерию Пирсона основана на сравнении эмпирического и гипотетического распределений, точнее, на сравнении эмпирических и гипотетических интервальных частот. Мера близости между ними оценивается статистикой Пирсона:

, где - интервальные (эмпирические) частоты, - интервальные теоретические частоты, - теоретические вероятности попадания переменной x в i-ый интервал группировки, , - левая граница i-го интервала, - правая граница i-го интервала.

При этом теоретические вероятности рассчитываются в предположении нормальности распределения случайной величины x по формуле:

, где и функция есть плотность стандартного нормального распределения, таблица значений которой приведена в приложении 2.

Вычисление наблюдаемого значения статистики Пирсона организуем в форме расчетной таблицы. Для заполнения таблицы нам понадобятся величины , , .

i
(3;5) 6,785 3,182 0,0025 0,0023 6,325 3,675 13,506 2,135
(5;7) 4,785 2,244 0,0325 0,0305 83,87 -13,87 192,516 2,295
(7;9) 2,785 1,306 0,1691 0,1586 436,15 13,85 191,823 0,440
(9;11) 0,785 0,368 0,3726 0,3495 961,12 8,875 78,766 0,082
(11;13) 1,215 0,570 0,3391 0,3181 874,78 -14,78 218,301 0,250
(13;15) 3,215 1,508 0,1276 0,1197 329,18 0,825 0,681 0,002
(15;17) 5,215 2,446 0,0198 0,0186 51,15 8,85 78,322 1,531
          0,9973       6,735

 

Следовательно, . Заданный уровень значимости , количество интервалов группировки , и потому p=1-a=0,95 и число степеней свободы k=m-3=4.

Теперь по таблице критических точек распределения отыщем значение .

Сравним значения и . Имеем 6,735<9,5 , следовательно, <. Поэтому гипотезу о нормальном распределении признака x принимаем. В этом случае необходимо найти с надежностью g=0,95 доверительные интервалы для оценки математического ожидания и среднего квадратического отклонения признака x генеральной совокупности. Пример нахождения доверительных интервалов разобран при решении задачи 1 (пятый вопрос).

Таким образом, решение задачи 2 полностью разобрано.