Задача 2.

Для выборки, извлеченной из генеральной совокупности и представленной интервальным рядом (в первой строке указаны интервалы значений исследуемого количественного признака X генеральной совокупности; во второй – частоты , т.е. количество элементов выборки, значения признака которых принадлежат указанному интервалу), требуется:

1) Построить полигон относительных накопленных частот (кумулятивную кривую);

2) Построить гистограмму частот и гистограмму относительных частот;

3) Найти выборочную среднюю, выборочную дисперсию, моду и медиану;

4) Проверить на уровне значимости гипотезу о нормальном распределении признака генеральной совокупности по критерию согласия Пирсона;

5) В случае согласованности с нормальным распределением найти с надежностью доверительные интервалы для оценки математического ожидания и среднего квадратического отклонения признака генеральной совокупности.

2.0.

	3-5	5-7	7-9	9-11	11-13	13-15	15-17

В нашем случае n=2750.Тогда на основе данной таблицы построим интервальный статистический и интервальный выборочный ряды распределения, сведенные в одну таблицу.

i
	3-5	5-7	7-9	9-11	11-13	13-15	15-17


	0,0036	0,0255	0,1636	0,3527	0,3127	0,12	0,0218
	0,0036	0,0291	0,1927	0,5454	0,8581	0,9781

Построим полигон относительных накопленных частот (кумулятивную кривую);

Построим гистограмму частот.

В нашем случае исследуемый признак X может принимать значения на отрезке [3;17]. Интервальная группировка выполнена таким образом, что длина каждого интервала равна h=2. Площадь прямоугольника, построенного на i-ом интервале, должна равняться . Это значит, что высота i-го прямоугольника будет .

На остальных интервалах прямоугольники строятся аналогично.

Если высоту i-го прямоугольника определим как , то получим гистограмму относительных частот, которую можно рассматривать как аналог дифференциальной функции распределения в теории вероятностей.

Для того, чтобы найти выборочную среднюю, воспользуемся формулой

, где k - количество интервалов, n - объем выборки.

Для вычисления выборочной дисперсии воспользуемся формулой . В случае интервальной группировки находится по формуле

Теперьможно окончательно вычислитьвыборочную дисперсию

Найдем выборочное среднее квадратическое отклонение

Отыщем выборочный коэффициент вариации

Найденное значение выборочного коэффициента вариации дает наглядное представление о степени относительного рассеяния исследуемого признака.

Отыщем значения "исправленной" дисперсии и "исправленного" среднего квадратического отклонения , .

Для отыскания моды в случае интервальной группировки используем формулу , где - левая граница интервала, имеющего наибольшую интервальную частоту, h - шаг (длина интервала группировки), , R - размах выборки, k - количество интервалов, - наибольшая интервальная частота, - интервальная частота интервала, расположенного слева от интервала с наибольшей интервальной частотой, - интервальная частота интервала, расположенного справа от интервала с наибольшей интервальной частотой.

В нашем случае .

Значение медианы для случая интервальной группировки отыщем по формуле , где - левая граница интервала, содержащего медиану, n - объем выборки, h - шаг, - интервальная частота интервала, содержащего медиану, - интервальные частоты всех интервалов, расположенных слева от интервала, содержащего медиану.

Найдем значение медианы для нашей конкретной задачи .

Далее начнем суммировать интервальные частоты слева направо до тех пор пока сумма интервальных частот не превзойдет .Номер последней прибавленной частоты будет совпадать с номером интервала, содержащего медиану распределения: 10+70+450+970=1500>1375. Следовательно, =9, .

Проверим на уровне значимости a=0,05 гипотезу о нормальном распределении признака x генеральной совокупности по критерию согласия Пирсона.

Для нашей задачи все условия применимости метода Пирсона выполняются: , для любого интервала .

Проверка гипотезы нормальности по критерию Пирсона основана на сравнении эмпирического и гипотетического распределений, точнее, на сравнении эмпирических и гипотетических интервальных частот. Мера близости между ними оценивается статистикой Пирсона:

, где - интервальные (эмпирические) частоты, - интервальные теоретические частоты, - теоретические вероятности попадания переменной x в i-ый интервал группировки, , - левая граница i-го интервала, - правая граница i-го интервала.

При этом теоретические вероятности рассчитываются в предположении нормальности распределения случайной величины x по формуле:

, где и функция есть плотность стандартного нормального распределения, таблица значений которой приведена в приложении 2.

Вычисление наблюдаемого значения статистики Пирсона организуем в форме расчетной таблицы. Для заполнения таблицы нам понадобятся величины , , .

i
	(3;5)	6,785	3,182	0,0025	0,0023	6,325	3,675	13,506	2,135
	(5;7)	4,785	2,244	0,0325	0,0305	83,87	-13,87	192,516	2,295
	(7;9)	2,785	1,306	0,1691	0,1586	436,15	13,85	191,823	0,440
	(9;11)	0,785	0,368	0,3726	0,3495	961,12	8,875	78,766	0,082
	(11;13)	1,215	0,570	0,3391	0,3181	874,78	-14,78	218,301	0,250
	(13;15)	3,215	1,508	0,1276	0,1197	329,18	0,825	0,681	0,002
	(15;17)	5,215	2,446	0,0198	0,0186	51,15	8,85	78,322	1,531
					0,9973				6,735

Следовательно, . Заданный уровень значимости , количество интервалов группировки , и потому p=1-a=0,95 и число степеней свободы k=m-3=4.

Теперь по таблице критических точек распределения отыщем значение .

Сравним значения и . Имеем 6,735<9,5 , следовательно, <. Поэтому гипотезу о нормальном распределении признака x принимаем. В этом случае необходимо найти с надежностью g=0,95 доверительные интервалы для оценки математического ожидания и среднего квадратического отклонения признака x генеральной совокупности. Пример нахождения доверительных интервалов разобран при решении задачи 1 (пятый вопрос).

Таким образом, решение задачи 2 полностью разобрано.