Различные виды дисперсии позволяют количественно оценить вариацию не только в целом по совокупности, но по группам, на которые разделена совокупность, и между группами. Для этого используются такие виды дисперсии как общая, межгрупповая, внутригрупповая. Рассмотрим их.
Общая дисперсия – это мера вариации результативного признака показателя, которая обусловлена действием всех факторов, вызвавших эту вариацию. Она может быть простой или взвешенной и определена следующим образом
. (5.16)
Межгрупповая дисперсия – это дисперсия, которая характеризует вариацию результативного признака показателя за счет фактора-признака, положенного в основу группировки единиц совокупности. Она может быть простой или взвешенной и определяется следующим образом
, (5.17)
где: k – количество групп;
nj – количество вариант в j – ой группе;
– средняя j – ой группе.
Внутригрупповая дисперсия – это дисперсия, которая отражает вариацию результативного признака в j – ой группе под действием факторов-признаков, которые не были учтены в основе группировки. Она бывает простой взвешенной и определяется следующим образом
, (5.18)
где: xij – значение i-ой варианты j-ой группы;
- средняя j-ой группы;
fij – частота i-ой варианты j-ой группы;
nj – количество вариант в j-ой группе.
Средняя из внутригрупповых дисперсий – это дисперсия, характеризующая среднюю величину вариации результативного признака показателя под действием факторов-признаков, не учтенных в основе группировки. Она равна
. (5.19)
Рассмотренные виды дисперсии связаны между собой следующим образом
. (5.20)
Данное соотношение называется правилом сложения дисперсий. Оно говорит о том, что общая дисперсия, возникшая под влиянием всех факторов, действующих на показатель, равна сумме дисперсии, отражающая действие фактора-признака, положенного в основу группировки, и дисперсии, отражающая действия всех неучтенных факторов. Таким образом, зная любые два вида дисперсии можно найти третий вид дисперсии.
Рассмотренные виды дисперсии позволяют оценить вариацию признака в относительной форме с помощью следующих коэффициентов.
Эмпирический коэффициент детерминации показывает долю межгрупповой дисперсии в общей дисперсии
. (5.21)
Эмпирический коэффициент детерминации изменяется от нуля до единицы. Чем больше коэффициент детерминации, тем больше доля межгрупповой дисперсии в общей, тем весомее роль фактора-признака, положенного в основу группировки.
Коэффициент эмпирического корреляционного отношения показывает степень влияния фактора-признака, положенного в основу группировки на вариацию результативного признака показателя.
. (5.22)
Коэффициент эмпирического корреляционного отношения изменяется от нуля до единицы. Если =0, то группировочный фактор-признак не оказывает на результативный признак никакого влияния и межгрупповая дисперсия равна нулю. Если =1, то между группировочным фактором-признаком и результативным признаком имеется функциональная связь. Рассмотрим пример расчета всех видов дисперсии.
Пример. Статистическое обследование об уровне заработной платы и его связи с образованием (среднее, специального) на участке №1 среди рабочих предприятия дало следующие результаты (табл. 5.6)
Таблица 5.6
Таб. N | Зарплата в руб. | Наличие образования |
да нет нет да да нет нет нет да нет |
При обследовании в качестве результативного признака единицы совокупности (рабочий) взята месячная зарплата, а в качестве группировочного фактора-признака единицы совокупности (рабочий) взято образования (общее, специальное). Надо отметить, что на заработную плату рабочего оказывают влияние также стаж работы, возраст рабочего, его квалификация и т.д. Однако целью статистического обследования было выяснение степени влияния образования на зарплату. Для решения этой задачи вся совокупность была разделена на две группы: 1 группа (нет образования), 2 группа (есть образование).
С помощью различных видов дисперсии определим роль образования на вариацию зарплаты. Для этого, вначале рассчитаем общую дисперсию как меру вариации зарплаты под действием всех факторов-признаков (табл.5.7)
Таблица 5.7
Зарплата в руб.() | Число рабочих () | ||||
-600 -300 | |||||
Итого |
Предварительно по формуле 4.2 рассчитаем среднюю зарплату, как среднюю взвешенную, используя итоговые данные граф 2,3 таблицы 5.7
Затем определим общую дисперсию, как взвешенную, по формуле 5.3
Она показывает, как в среднем варьируется зарплата у рабочих под действием всех факторов-признаков, в том числе и образования.
Затем определим внутригрупповую дисперсию в первой группе, которая показывает распределение зарплаты у рабочих, не имеющих образование (табл. 5.8)
Таблица 5.8
Зарплата в руб.() | Число рабочих () | ||||
-200 | |||||
Итого |
Средняя зарплата в первой группе по итоговым данным граф 2,3 таблицы 5.8 будет равна
Тогда внутригрупповая дисперсия в первой группе будет равна
Расчет показывает, что в первой группе за счет неучтенных факторов-признаков вариация зарплаты составляет 50000 руб2.
Аналогичным образом проведем расчет и по первой группе, которая включает рабочих, имеющих образование (расчет провести самостоятельно). Он даст следующие результаты: средняя зарплата во второй группе будет равна = 2400 руб., а дисперсия - -168750 руб2.
Теперь по формуле 5.19 найдем среднюю из внутригрупповых дисперсий
Найденная средняя из внутригрупповых дисперсий показывает, что зарплата рабочих колеблется под действием неучтенных факторов-признаков в среднем на 97500 руб2.
Теперь по формуле 5.17 определим величину межгрупповой дисперсии, как взвешенную
Расчет показывает, что за счет учета фактора-признака – образование колеблемость зарплаты у рабочих в среднем составляла 240000 руб2. Проверим правильность проведенных расчетов с помощью формулы 5.20, которая устанавливает взаимосвязь общей дисперсии с межгрупповой и внутригрупповой дисперсии
Оценим полученные значения видов дисперсии с помощью эмпирического коэффициента детерминации и коэффициента эмпирического корреляционного отношения.
Эмпирический коэффициент детерминации равен
Он показывает, что доля межгрупповой дисперсии в общей дисперсии равна 0,71 или 71%. А коэффициент эмпирического корреляционного отношения равен
Он показывает, 84,3% колеблемости зарплаты рабочих объясняется действием фактора-признака – образование, а оставшаяся часть колеблемости (15,7%) объясняется действием неучтенных факторов (возраст, квалификация, стаж и т.д.). На основе проведенных расчетов можно сделать вывод: величина зарплаты в первую очередь зависит от уровня образования рабочего.