Для выборки, извлеченной из генеральной совокупности и представленной интервальным рядом (в первой строке указаны интервалы значений исследуемого количественного признака X генеральной совокупности; во второй – частоты , т.е. количество элементов выборки, значения признака которых принадлежат указанному интервалу), требуется:
1) Построить полигон относительных накопленных частот (кумулятивную кривую);
2) Построить гистограмму частот и гистограмму относительных частот;
3) Найти выборочную среднюю, выборочную дисперсию, моду и медиану;
4) Проверить на уровне значимости гипотезу о нормальном распределении признака генеральной совокупности по критерию согласия Пирсона;
5) В случае согласованности с нормальным распределением найти с надежностью доверительные интервалы для оценки математического ожидания и среднего квадратического отклонения признака генеральной совокупности.
2.0.
3-5 | 5-7 | 7-9 | 9-11 | 11-13 | 13-15 | 15-17 | |
.
В нашем случае n=2750.Тогда на основе данной таблицы построим интервальный статистический и интервальный выборочный ряды распределения, сведенные в одну таблицу.
i | |||||||
3-5 | 5-7 | 7-9 | 9-11 | 11-13 | 13-15 | 15-17 | |
0,0036 | 0,0255 | 0,1636 | 0,3527 | 0,3127 | 0,12 | 0,0218 | |
0,0036 | 0,0291 | 0,1927 | 0,5454 | 0,8581 | 0,9781 |
Построим гистограмму частот.
В нашем случае исследуемый признак X может принимать значения на отрезке [3;17]. Интервальная группировка выполнена таким образом, что длина каждого интервала равна h=2. Площадь прямоугольника, построенного на i-ом интервале, должна равняться . Это значит, что высота i-го прямоугольника будет .
На остальных интервалах прямоугольники строятся аналогично.
Если высоту i-го прямоугольника определим как , то получим гистограмму относительных частот, которую можно рассматривать как аналог дифференциальной функции распределения в теории вероятностей.
Для того, чтобы найти выборочную среднюю, воспользуемся формулой
, где k - количество интервалов, n - объем выборки.
.
Для вычисления выборочной дисперсии воспользуемся формулой . В случае интервальной группировки находится по формуле
=.
Теперьможно окончательно вычислитьвыборочную дисперсию
.
Найдем выборочное среднее квадратическое отклонение
.
Отыщем выборочный коэффициент вариации
.
Найденное значение выборочного коэффициента вариации дает наглядное представление о степени относительного рассеяния исследуемого признака.
Отыщем значения "исправленной" дисперсии и "исправленного" среднего квадратического отклонения , .
Для отыскания моды в случае интервальной группировки используем формулу , где - левая граница интервала, имеющего наибольшую интервальную частоту, h - шаг (длина интервала группировки), , R - размах выборки, k - количество интервалов, - наибольшая интервальная частота, - интервальная частота интервала, расположенного слева от интервала с наибольшей интервальной частотой, - интервальная частота интервала, расположенного справа от интервала с наибольшей интервальной частотой.
В нашем случае .
Значение медианы для случая интервальной группировки отыщем по формуле , где - левая граница интервала, содержащего медиану, n - объем выборки, h - шаг, - интервальная частота интервала, содержащего медиану, - интервальные частоты всех интервалов, расположенных слева от интервала, содержащего медиану.
Найдем значение медианы для нашей конкретной задачи .
Далее начнем суммировать интервальные частоты слева направо до тех пор пока сумма интервальных частот не превзойдет .Номер последней прибавленной частоты будет совпадать с номером интервала, содержащего медиану распределения: 10+70+450+970=1500>1375. Следовательно, =9, .
Проверим на уровне значимости a=0,05 гипотезу о нормальном распределении признака x генеральной совокупности по критерию согласия Пирсона.
Для нашей задачи все условия применимости метода Пирсона выполняются: , для любого интервала .
Проверка гипотезы нормальности по критерию Пирсона основана на сравнении эмпирического и гипотетического распределений, точнее, на сравнении эмпирических и гипотетических интервальных частот. Мера близости между ними оценивается статистикой Пирсона:
, где - интервальные (эмпирические) частоты, - интервальные теоретические частоты, - теоретические вероятности попадания переменной x в i-ый интервал группировки, , - левая граница i-го интервала, - правая граница i-го интервала.
При этом теоретические вероятности рассчитываются в предположении нормальности распределения случайной величины x по формуле:
, где и функция есть плотность стандартного нормального распределения, таблица значений которой приведена в приложении 2.
Вычисление наблюдаемого значения статистики Пирсона организуем в форме расчетной таблицы. Для заполнения таблицы нам понадобятся величины , , .
i | |||||||||||
(3;5) | 6,785 | 3,182 | 0,0025 | 0,0023 | 6,325 | 3,675 | 13,506 | 2,135 | |||
(5;7) | 4,785 | 2,244 | 0,0325 | 0,0305 | 83,87 | -13,87 | 192,516 | 2,295 | |||
(7;9) | 2,785 | 1,306 | 0,1691 | 0,1586 | 436,15 | 13,85 | 191,823 | 0,440 | |||
(9;11) | 0,785 | 0,368 | 0,3726 | 0,3495 | 961,12 | 8,875 | 78,766 | 0,082 | |||
(11;13) | 1,215 | 0,570 | 0,3391 | 0,3181 | 874,78 | -14,78 | 218,301 | 0,250 | |||
(13;15) | 3,215 | 1,508 | 0,1276 | 0,1197 | 329,18 | 0,825 | 0,681 | 0,002 | |||
(15;17) | 5,215 | 2,446 | 0,0198 | 0,0186 | 51,15 | 8,85 | 78,322 | 1,531 | |||
0,9973 | 6,735 |
Следовательно, . Заданный уровень значимости , количество интервалов группировки , и потому p=1-a=0,95 и число степеней свободы k=m-3=4.
Теперь по таблице критических точек распределения отыщем значение .
Сравним значения и . Имеем 6,735<9,5 , следовательно, <. Поэтому гипотезу о нормальном распределении признака x принимаем. В этом случае необходимо найти с надежностью g=0,95 доверительные интервалы для оценки математического ожидания и среднего квадратического отклонения признака x генеральной совокупности. Пример нахождения доверительных интервалов разобран при решении задачи 1 (пятый вопрос).
Таким образом, решение задачи 2 полностью разобрано.