Задача. В таблице 1 приведены денежные затраты Х на животноводство, заданные выборкой по 60 хозяйствам области, дес. тыс. руб. на 100 голов

       
   
 
 

 

ПРИМЕР ВЫПОЛНЕНИЯ РАБОТЫ

 


Задача. В таблице 1 приведены денежные затраты Х на животноводство, заданные выборкой по 60 хозяйствам области, дес. тыс. руб. на 100 голов.

Таблица 1

X X X X X X
       

 

Требуется для признака Х:

1. Построить интервальный ряд распределения; для каждого интервала подсчитать локальные, а также накопленные частоты; построить вариационный ряд;

2. Построить полигон и гистограмму;

3. Определить выборочную среднюю; а также низшую и высшую частные средние; моду и медиану; дисперсию и среднее квадратическое отклонение; коэффициент вариации;

4. Проверить при уровне значимости 0,05 гипотезу о нормальном законе распределения соответствующего признака с помощью критериев согласия χ2 ─ Пирсона и ─ Смирнова;

5. Найти точечные и интервальные оценки генеральной средней и среднего квадратического отклонения (при доверительной вероятности р = =0,95);

6. Найти ошибки выборочных оценок;

7. Произвести анализ всех вычисленных статистических параметров.

Решение.

1) Составим интервальный ряд для признака Х. Для этого найдём размах варьирования значений признака по формуле: RХ =Xmax - Xmin.

Из таблицы 1 следует: Xmax = 68 ; Xmin = 18 и RХ = 68 - 18 = 50.

Число интервалов m, на которые следует разбить интервал значений признака, найдём по формуле Стерджеса: m = 1+3,322 lg n, где n - объём выборки, то есть число единиц наблюдения.

В нашем примере n=60. Получим: m = 1+3,322•lg 60 = 1+3,322•1,778 = =6,9 ≈7. Таким образом, следует образовать 7 интервалов.

Теперь рассчитаем шаг (длину частичного интервала) h по формуле: h= =7,1. Округление шага производится, как правило, в большую сторону. Таким образом, принимаем h=8.

За начало первого интервала принимаем такое значение из интервала (Хmin; Xmin- ), чтобы середина полученного интервала оказалась удобным для расчетов числом. В нашем случае за нижнюю границу интервала возьмём Xmin - 2 = 18 - 2 = 16. В результате получим следующие границы интервалов: 16-24-32-40-48-56-64-72.

Теперь произведём разноску значений признака по интервалам и подсчитаем число вариант, попавших в каждый из них, применяя так называемый метод конверта, когда каждую варианту, попавшую в интервал, обозначают точкой или отрезком. Варианты, совпадающие с границами частичных интервалов, включают в правый интервал. В табл. 2 произведена разноска значений признака Х, указаны интервалы, середины интервалов, частоты ni, которые представляют собой число вариант, попавших в данный интервал, и накопленные частоты, равные сумме частот значений признака Х, попавших в предшествующие интервалы. Интервалы и их частоты представляют собой интервальный ряд. Середины интервалов и соответствующие частоты дают вариационный ряд (табл. 3).

Таблица 2

Распределение частот денежных затрат на животноводство

Вариационный серединный ряд   Варианта, хi   Частота,…   2) Графически интервальный ряд изображают с помощью гистограммы. Для её построения в прямоугольной системе координат…

Таблица 5

Характеристика Обозначение Значение
Выборочная средняя, дес. тыс. руб.     45,5
Размах варьирования, дес. тыс. руб.   RX  
Высшая средняя, дес. тыс. руб.     56,6
Низшая средняя, дес. тыс. руб.     36,9
Мода, дес, тыс. руб. Mo 46,4
Медиана, дес. тыс. руб Me 45,9
Дисперсия, кв. дес. тыс. руб.   SX2   141,9
Стандарт, дес. тыс. руб. SX 11,9
Коэффициент вариации, %   VX   26,2

 

4) Проверим гипотезу о соответствии данных ряда (табл. 3) нормальному закону распределения сначала по критерию Пирсона χ2. Для этого сравним наблюдаемые ni и теоретические nit (вычисленные в предположении нормального распределения) частоты. Теоретические частоты рассчитываются по формуле: , где nit ─ теоретические частоты, n ─ объём выборки, h ─ шаг (длина) частичного интервала, ─ нормированное отклонение, xi ─ середины частичных интервалов, ─ выборочная средняя, SХ ─ стандарт, ─ дифференциальная функция Лапласа (значения даны в приложении 1).

 
Критерий Пирсона применяется при условии, что все группы ряда включают частоты не меньшие 5 (т.е. ni 5). Если частота группы ряда менее 5, то эту группу следует объединить с соседней. Расчёты проверки критерия Пирсона поместим в табл. 6, вычислив предварительно , и используя, что .

Таблица 6

Хi Ni nit ni-nit
-2,14 0,0404 1,6 0,9 0,11
-1,47 0,1354 5,5
-0,8 0,2897 11,7 0,7 0,04
-0,13 0,3956 16,0 -1 0,06
0,8 0,2897 11,7 2,3 0,45
1,22 0,1895 7,6 1,7 0,28
1,89 0,0669 2,7
56,8 0,94

 

Поскольку частоты крайних групп n1 = 3 < 5 и n7 = 3 < 5, то объединяем их с соседними группами.

Сумма последнего столбца определяет фактическую величину критерия Пирсона χф2 = 0,94. Эта величина сравнивается с предельным значением χкр2, значения которой даны в таблице (приложение 4) в зависимости от уровня значимости и числа степеней свободы , где ─ число групп вариационного ряда.

В условиях задачи, принимая надёжность результатов равной 95% (р = =0,95), уровень значимости расчётов будет равен .

Число групп вариационного ряда, после объединения первой и второй, а так же шестой и седьмой групп, равна = 5, следовательно, число степеней свободы к = 5 - 3 = 2. Предельное значение критерия χкр2 при и к=2, находим по таблице приложения 4.

Сравнение фактического и критического значений даёт:

Следовательно, с надёжностью р=95% можно принять гипотезу, что разность частот между фактическим и нормальным распределением несущественна, а получена за счёт случайных отклонений, и данное распределение вариант можно считать подчиняющимся закону нормального распределения.

Критерий Пирсона, как правило, используется, когда объём выборки n>100. Когда же 50<n<100, то наиболее эффективен критерий - Смирнова. Проверим гипотезу о нормальном распределении признака по этому критерию.

Критерий - Смирнова основан на определении существенности различий между накопленными частостями эмпирического Fi и теоретического Fit распределений.

Фактическое значение критерия ф2 вычисляют по формуле: , где Fi ─ накопленная частость i-ой группы,

Fit ─ теоретическое значение накопленной частости i-ой группы.

Вычисленное значение сравнивают с критическим значением , которое находится по таблице для величины n и уровня значимости . В частности, для = 0,05 .

Для n = 60 .

Расчёт поместим в таблицу 7, в которую также внесём сделанные ранее вычисления теоретических частот nit нормального распределения.

Таблица 7

  Xi   Фактическое распределение Нормальное распределение     Fi- Fit   (Fi- Fit)2*10 -6
Частота ni Частость Накоплен. Частость Fi Частота nit Частость Накоплен. Частость Fit
  0,050 0,050 1,6 0,027 0,027 0,023
0,083 0,133 5,5 0,092 0,119 0,014
0,183 0,316 11,7 0,195 0,314 0,002
0,250 0,566 16,0 0,267 0,581 -0,015
0,233 0,799 11,7 0,195 0,776 0,023
0,150 0,949 7,6 0,127 0,903 0,046
1,050 0,999 2,7 0,045 0,948 0,051
0,999   56,8       6200*10-6

 

Сравнение фактического и предельного значений даёт: Следовательно, с надёжностью р = 0,95 можно полагать, что данная выборка подчиняется закону нормального распределения.

Найдём точечные и интервальные оценки генеральной средней и генерального среднего квадратического отклонения.

Точечной называют статистическую оценку, которая определяется одним числом. Для генеральной средней точечной оценкой является выборочная средняя,… Таким образом, для нашей задачи точечная оценка генеральной средней – это… Интервальной называют оценку, которая определяется двумя числами ─ концами интервала, покрывающего оцениваемый…