Для оценки достоверности различий между тремя и более средними величинами целесообразно применить дисперсионный анализ. Модель дисперсионного анализа, используемая в работе – однофакторный факторный дисперсионный анализ. Данный метод позволяет оценить влияние группировочного признака (фактора) на изменение результативного признака.
В отличие от корреляционного анализа, в дисперсионном исследователь исходит из предположения, что одни переменные выступают как влияющие (именуемые факторами или независимыми переменными), а другие (результативные признаки или зависимые переменные) – подвержены влиянию этих факторов. Хотя такое допущение и лежит в основе математических процедур расчета, оно, однако, требует осторожности рассуждений об источнике и объекте влияния.[5] Для анализа рассмотрим таблицу 11
Таблица 11
Численность занятых мужчин и женщин по возрастным группам в 2011 г.
Возрастные группы | Численность занятых мужчин, тыс. чел. f1 | Численность занятых женщин, тыс. чел. f2 | Центр интервала, х | x ×f1 | x×f2 | ||
До 20 | 1,8 | 1,12 | 14,5 | 26,10 | 16,24 | 1116,02 | 757,12 |
20-29 | 41,4 | 34,48 | 24,5 | 1014,30 | 844,76 | 9191,21 | 8826,88 |
30-39 | 41,4 | 40,1 | 34,5 | 1428,30 | 1383,45 | 994,01 | 1443,60 |
40-49 | 38,95 | 42,66 | 44,5 | 1733,28 | 1898,37 | 1013,09 | 682,56 |
50-59 | 33,38 | 35,12 | 54,5 | 1819,21 | 1914,04 | 7610,97 | 6883,52 |
60 и старше | 6,71 | 6,9 | 64,5 | 432,80 | 445,05 | 4227,37 | 3974,40 |
Итого | 158,2 | 166,9 | - | 6453,98 | 6501,91 | 24152,68 | 22568,08 |
По данным таблицы 5 рассчитаем средний возраст занятых мужчин и женщин в Новгородской области.
Средний возраст занятых мужчин:
лет
Средний возраст занятых женщин:
лет
Общая дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию и рассчитывается по формуле:
Межгрупповая дисперсия характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возникающие под влиянием признака-фактора, положенного в основание группировки. Она рассчитывается по формуле:
где – число единиц в j–й группе;
- частная средняя по j–й группе;
- общая средняя по совокупности единиц.
Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она исчисляется следующим образом:
Внутригрупповые дисперсии:
По совокупности в целом вариация значений признака под влиянием прочих факторов характеризуется средней их внутригрупповых дисперсий, которая рассчитывается по формуле:
Средняя из внутригрупповых дисперсий:
Межгрупповая дисперсия:
Между общей дисперсией, средней из внутригрупповых дисперсий и межгрупповой дисперсией существует соотношение, определяемое правилом сложения дисперсий:
Найдем общую дисперсию по правилу сложения дисперсий:
Полученный результат равен общей дисперсии, рассчитанной обычным способом.
Эмпирический коэффициент детерминации определяется по формуле:
Он показывает, какая доля в общей дисперсии приходится на дисперсию, обусловленную вариацией признака, положенного в основу группировки.
Сопоставив межгрупповую дисперсию с общей дисперсией, рассчитаем коэффициент детерминации:
или 1,1%.
Коэффициент детерминации показывает, что дисперсия возраста занятых зависит от пола людей на 1,1%. Остальные 98,9% определяются множеством других неучтенных факторов.
Эмпирическое корреляционное отношение определяется по формуле:
Это отношение характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака.
Эмпирическое корреляционное отношение:
Полученное значение эмпирического корреляционного отношения позволяет утверждать, что связи между полом людей и возрастом безработных нет.
Для проверки существенности связи между группировочным признаком и вариацией исследуемого признака используется дисперсионное отношение F (критерий Фишера):
где и - число степеней свободы для сравниваемых дисперсий, при этом =m-1; =N-m;
m – число групп,
N – число наблюдений.
Проверим существенность связи между группировочным признаком и вариацией исследуемого признака по критерию Фишера при =2-1= 1 и = 325,1 – 2 = 323,1 и уровне значимости 0,05, Fкрит. = 4,45:
Т.к. Fрасч = 0,034 < Fкрит. = 4,45 при уровне значимости 0,05, то это говорит об отсутствии связи между полом и возрастом безработных.