Дисперсионный анализ уровня занятости

Для оценки достоверности различий между тремя и более средними величинами целесообразно применить дисперсионный анализ. Модель дисперсионного анализа, используемая в работе – однофакторный факторный дисперсионный анализ. Данный метод позволяет оценить влияние группировочного признака (фактора) на изменение результативного признака.

В отличие от корреляционного анализа, в дисперсионном исследователь исходит из предположения, что одни переменные выступают как влияющие (именуемые факторами или независимыми переменными), а другие (результативные признаки или зависимые переменные) – подвержены влиянию этих факторов. Хотя такое допущение и лежит в основе математических процедур расчета, оно, однако, требует осторожности рассуждений об источнике и объекте влияния.[5] Для анализа рассмотрим таблицу 11

 

Таблица 11

Численность занятых мужчин и женщин по возрастным группам в 2011 г.

Возрастные группы Численность занятых мужчин, тыс. чел. f1 Численность занятых женщин, тыс. чел. f2 Центр интервала, х x ×f1 x×f2    
До 20 1,8 1,12 14,5 26,10 16,24 1116,02 757,12
20-29 41,4 34,48 24,5 1014,30 844,76 9191,21 8826,88
30-39 41,4 40,1 34,5 1428,30 1383,45 994,01 1443,60
40-49 38,95 42,66 44,5 1733,28 1898,37 1013,09 682,56
50-59 33,38 35,12 54,5 1819,21 1914,04 7610,97 6883,52
60 и старше 6,71 6,9 64,5 432,80 445,05 4227,37 3974,40
Итого 158,2 166,9 - 6453,98 6501,91 24152,68 22568,08

 

По данным таблицы 5 рассчитаем средний возраст занятых мужчин и женщин в Новгородской области.

Средний возраст занятых мужчин:

лет

Средний возраст занятых женщин:

лет

Общая дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию и рассчитывается по формуле:

 

Межгрупповая дисперсия характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возникающие под влиянием признака-фактора, положенного в основание группировки. Она рассчитывается по формуле:

 

где – число единиц в j–й группе;

- частная средняя по j–й группе;

- общая средняя по совокупности единиц.

Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она исчисляется следующим образом:

 

Внутригрупповые дисперсии:

 

 

 

По совокупности в целом вариация значений признака под влиянием прочих факторов характеризуется средней их внутригрупповых дисперсий, которая рассчитывается по формуле:

 

Средняя из внутригрупповых дисперсий:

 

Межгрупповая дисперсия:

 

 

Между общей дисперсией, средней из внутригрупповых дисперсий и межгрупповой дисперсией существует соотношение, определяемое правилом сложения дисперсий:

 

Найдем общую дисперсию по правилу сложения дисперсий:

 

Полученный результат равен общей дисперсии, рассчитанной обычным способом.

Эмпирический коэффициент детерминации определяется по формуле:

 

Он показывает, какая доля в общей дисперсии приходится на дисперсию, обусловленную вариацией признака, положенного в основу группировки.

Сопоставив межгрупповую дисперсию с общей дисперсией, рассчитаем коэффициент детерминации:

или 1,1%.

Коэффициент детерминации показывает, что дисперсия возраста занятых зависит от пола людей на 1,1%. Остальные 98,9% определяются множеством других неучтенных факторов.

Эмпирическое корреляционное отношение определяется по формуле:

 

Это отношение характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака.

Эмпирическое корреляционное отношение:

 

Полученное значение эмпирического корреляционного отношения позволяет утверждать, что связи между полом людей и возрастом безработных нет.

Для проверки существенности связи между группировочным признаком и вариацией исследуемого признака используется дисперсионное отношение F (критерий Фишера):

 

где и - число степеней свободы для сравниваемых дисперсий, при этом =m-1; =N-m;

m – число групп,

N – число наблюдений.

Проверим существенность связи между группировочным признаком и вариацией исследуемого признака по критерию Фишера при =2-1= 1 и = 325,1 – 2 = 323,1 и уровне значимости 0,05, Fкрит. = 4,45:

 

Т.к. Fрасч = 0,034 < Fкрит. = 4,45 при уровне значимости 0,05, то это говорит об отсутствии связи между полом и возрастом безработных.