ПРИМЕР ВЫПОЛНЕНИЯ РАБОТЫ
Задача. В таблице 1 приведены денежные затраты Х на животноводство, заданные выборкой по 60 хозяйствам области, дес. тыс. руб. на 100 голов.
Таблица 1
X | X | X | X | X | X |
Требуется для признака Х:
1. Построить интервальный ряд распределения; для каждого интервала подсчитать локальные, а также накопленные частоты; построить вариационный ряд;
2. Построить полигон и гистограмму;
3. Определить выборочную среднюю; а также низшую и высшую частные средние; моду и медиану; дисперсию и среднее квадратическое отклонение; коэффициент вариации;
4. Проверить при уровне значимости 0,05 гипотезу о нормальном законе распределения соответствующего признака с помощью критериев согласия χ2 ─ Пирсона и ─ Смирнова;
5. Найти точечные и интервальные оценки генеральной средней и среднего квадратического отклонения (при доверительной вероятности р = =0,95);
6. Найти ошибки выборочных оценок;
7. Произвести анализ всех вычисленных статистических параметров.
Решение.
1) Составим интервальный ряд для признака Х. Для этого найдём размах варьирования значений признака по формуле: RХ =Xmax - Xmin.
Из таблицы 1 следует: Xmax = 68 ; Xmin = 18 и RХ = 68 - 18 = 50.
Число интервалов m, на которые следует разбить интервал значений признака, найдём по формуле Стерджеса: m = 1+3,322 lg n, где n - объём выборки, то есть число единиц наблюдения.
В нашем примере n=60. Получим: m = 1+3,322•lg 60 = 1+3,322•1,778 = =6,9 ≈7. Таким образом, следует образовать 7 интервалов.
Теперь рассчитаем шаг (длину частичного интервала) h по формуле: h= =7,1. Округление шага производится, как правило, в большую сторону. Таким образом, принимаем h=8.
За начало первого интервала принимаем такое значение из интервала (Хmin; Xmin- ), чтобы середина полученного интервала оказалась удобным для расчетов числом. В нашем случае за нижнюю границу интервала возьмём Xmin - 2 = 18 - 2 = 16. В результате получим следующие границы интервалов: 16-24-32-40-48-56-64-72.
Теперь произведём разноску значений признака по интервалам и подсчитаем число вариант, попавших в каждый из них, применяя так называемый метод конверта, когда каждую варианту, попавшую в интервал, обозначают точкой или отрезком. Варианты, совпадающие с границами частичных интервалов, включают в правый интервал. В табл. 2 произведена разноска значений признака Х, указаны интервалы, середины интервалов, частоты ni, которые представляют собой число вариант, попавших в данный интервал, и накопленные частоты, равные сумме частот значений признака Х, попавших в предшествующие интервалы. Интервалы и их частоты представляют собой интервальный ряд. Середины интервалов и соответствующие частоты дают вариационный ряд (табл. 3).
Таблица 2
Таблица 5
Характеристика | Обозначение | Значение |
Выборочная средняя, дес. тыс. руб. | 45,5 | |
Размах варьирования, дес. тыс. руб. | RX | |
Высшая средняя, дес. тыс. руб. | 56,6 | |
Низшая средняя, дес. тыс. руб. | 36,9 | |
Мода, дес, тыс. руб. | Mo | 46,4 |
Медиана, дес. тыс. руб | Me | 45,9 |
Дисперсия, кв. дес. тыс. руб. | SX2 | 141,9 |
Стандарт, дес. тыс. руб. | SX | 11,9 |
Коэффициент вариации, % | VX | 26,2 |
4) Проверим гипотезу о соответствии данных ряда (табл. 3) нормальному закону распределения сначала по критерию Пирсона χ2. Для этого сравним наблюдаемые ni и теоретические nit (вычисленные в предположении нормального распределения) частоты. Теоретические частоты рассчитываются по формуле: , где nit ─ теоретические частоты, n ─ объём выборки, h ─ шаг (длина) частичного интервала, ─ нормированное отклонение, xi ─ середины частичных интервалов, ─ выборочная средняя, SХ ─ стандарт, ─ дифференциальная функция Лапласа (значения даны в приложении 1).
|
Таблица 6
Хi | Ni | nit | ni-nit | |||
-2,14 | 0,0404 | 1,6 | 0,9 | 0,11 | ||
-1,47 | 0,1354 | 5,5 | ||||
-0,8 | 0,2897 | 11,7 | 0,7 | 0,04 | ||
-0,13 | 0,3956 | 16,0 | -1 | 0,06 | ||
0,8 | 0,2897 | 11,7 | 2,3 | 0,45 | ||
1,22 | 0,1895 | 7,6 | 1,7 | 0,28 | ||
1,89 | 0,0669 | 2,7 | ||||
─ | ─ | 56,8 | ─ | 0,94 |
Поскольку частоты крайних групп n1 = 3 < 5 и n7 = 3 < 5, то объединяем их с соседними группами.
Сумма последнего столбца определяет фактическую величину критерия Пирсона χф2 = 0,94. Эта величина сравнивается с предельным значением χкр2, значения которой даны в таблице (приложение 4) в зависимости от уровня значимости и числа степеней свободы , где ─ число групп вариационного ряда.
В условиях задачи, принимая надёжность результатов равной 95% (р = =0,95), уровень значимости расчётов будет равен .
Число групп вариационного ряда, после объединения первой и второй, а так же шестой и седьмой групп, равна = 5, следовательно, число степеней свободы к = 5 - 3 = 2. Предельное значение критерия χкр2 при и к=2, находим по таблице приложения 4.
Сравнение фактического и критического значений даёт:
Следовательно, с надёжностью р=95% можно принять гипотезу, что разность частот между фактическим и нормальным распределением несущественна, а получена за счёт случайных отклонений, и данное распределение вариант можно считать подчиняющимся закону нормального распределения.
Критерий Пирсона, как правило, используется, когда объём выборки n>100. Когда же 50<n<100, то наиболее эффективен критерий - Смирнова. Проверим гипотезу о нормальном распределении признака по этому критерию.
Критерий - Смирнова основан на определении существенности различий между накопленными частостями эмпирического Fi и теоретического Fit распределений.
Фактическое значение критерия ф2 вычисляют по формуле: , где Fi ─ накопленная частость i-ой группы,
Fit ─ теоретическое значение накопленной частости i-ой группы.
Вычисленное значение сравнивают с критическим значением , которое находится по таблице для величины n и уровня значимости . В частности, для = 0,05 .
Для n = 60 .
Расчёт поместим в таблицу 7, в которую также внесём сделанные ранее вычисления теоретических частот nit нормального распределения.
Таблица 7
Xi | Фактическое распределение | Нормальное распределение | Fi- Fit | (Fi- Fit)2*10 -6 | ||||
Частота ni | Частость | Накоплен. Частость Fi | Частота nit | Частость | Накоплен. Частость Fit | |||
0,050 | 0,050 | 1,6 | 0,027 | 0,027 | 0,023 | |||
0,083 | 0,133 | 5,5 | 0,092 | 0,119 | 0,014 | |||
0,183 | 0,316 | 11,7 | 0,195 | 0,314 | 0,002 | |||
0,250 | 0,566 | 16,0 | 0,267 | 0,581 | -0,015 | |||
0,233 | 0,799 | 11,7 | 0,195 | 0,776 | 0,023 | |||
0,150 | 0,949 | 7,6 | 0,127 | 0,903 | 0,046 | |||
1,050 | 0,999 | 2,7 | 0,045 | 0,948 | 0,051 | |||
0,999 | 56,8 | 6200*10-6 |
Сравнение фактического и предельного значений даёт: Следовательно, с надёжностью р = 0,95 можно полагать, что данная выборка подчиняется закону нормального распределения.