Дисперсия – виды, сложение дисперсий

Различные виды дисперсии позволяют количественно оценить вариацию не только в целом по совокупности, но по группам, на которые разделена совокупность, и между группами. Для этого используются такие виды дисперсии как общая, межгрупповая, внутригрупповая. Рассмотрим их.

Общая дисперсия – это мера вариации результативного признака показателя, которая обусловлена действием всех факторов, вызвавших эту вариацию. Она может быть простой или взвешенной и определена следующим образом

. (5.16)

Межгрупповая дисперсия – это дисперсия, которая характеризует вариацию результативного признака показателя за счет фактора-признака, положенного в основу группировки единиц совокупности. Она может быть простой или взвешенной и определяется следующим образом

, (5.17)

где: k – количество групп;

nj – количество вариант в j – ой группе;

– средняя j – ой группе.

Внутригрупповая дисперсия – это дисперсия, которая отражает вариацию результативного признака в j – ой группе под действием факторов-признаков, которые не были учтены в основе группировки. Она бывает простой взвешенной и определяется следующим образом

, (5.18)

где: xij – значение i-ой варианты j-ой группы;

- средняя j-ой группы;

fij – частота i-ой варианты j-ой группы;

nj – количество вариант в j-ой группе.

Средняя из внутригрупповых дисперсий – это дисперсия, характеризующая среднюю величину вариации результативного признака показателя под действием факторов-признаков, не учтенных в основе группировки. Она равна

. (5.19)

 

Рассмотренные виды дисперсии связаны между собой следующим образом

. (5.20)

Данное соотношение называется правилом сложения дисперсий. Оно говорит о том, что общая дисперсия, возникшая под влиянием всех факторов, действующих на показатель, равна сумме дисперсии, отражающая действие фактора-признака, положенного в основу группировки, и дисперсии, отражающая действия всех неучтенных факторов. Таким образом, зная любые два вида дисперсии можно найти третий вид дисперсии.

Рассмотренные виды дисперсии позволяют оценить вариацию признака в относительной форме с помощью следующих коэффициентов.

Эмпирический коэффициент детерминации показывает долю межгрупповой дисперсии в общей дисперсии

. (5.21)

Эмпирический коэффициент детерминации изменяется от нуля до единицы. Чем больше коэффициент детерминации, тем больше доля межгрупповой дисперсии в общей, тем весомее роль фактора-признака, положенного в основу группировки.

Коэффициент эмпирического корреляционного отношения показывает степень влияния фактора-признака, положенного в основу группировки на вариацию результативного признака показателя.

. (5.22)

Коэффициент эмпирического корреляционного отношения изменяется от нуля до единицы. Если =0, то группировочный фактор-признак не оказывает на результативный признак никакого влияния и межгрупповая дисперсия равна нулю. Если =1, то между группировочным фактором-признаком и результативным признаком имеется функциональная связь. Рассмотрим пример расчета всех видов дисперсии.

Пример. Статистическое обследование об уровне заработной платы и его связи с образованием (среднее, специального) на участке №1 среди рабочих предприятия дало следующие результаты (табл. 5.6)

Таблица 5.6

Таб. N Зарплата в руб. Наличие образования
да нет нет да да нет нет нет да нет

При обследовании в качестве результативного признака единицы совокупности (рабочий) взята месячная зарплата, а в качестве группировочного фактора-признака единицы совокупности (рабочий) взято образования (общее, специальное). Надо отметить, что на заработную плату рабочего оказывают влияние также стаж работы, возраст рабочего, его квалификация и т.д. Однако целью статистического обследования было выяснение степени влияния образования на зарплату. Для решения этой задачи вся совокупность была разделена на две группы: 1 группа (нет образования), 2 группа (есть образование).

С помощью различных видов дисперсии определим роль образования на вариацию зарплаты. Для этого, вначале рассчитаем общую дисперсию как меру вариации зарплаты под действием всех факторов-признаков (табл.5.7)

Таблица 5.7

Зарплата в руб.() Число рабочих ()        
-600 -300
Итого    

 

Предварительно по формуле 4.2 рассчитаем среднюю зарплату, как среднюю взвешенную, используя итоговые данные граф 2,3 таблицы 5.7

Затем определим общую дисперсию, как взвешенную, по формуле 5.3

Она показывает, как в среднем варьируется зарплата у рабочих под действием всех факторов-признаков, в том числе и образования.

Затем определим внутригрупповую дисперсию в первой группе, которая показывает распределение зарплаты у рабочих, не имеющих образование (табл. 5.8)

Таблица 5.8

Зарплата в руб.() Число рабочих ()        
-200
Итого    

 

Средняя зарплата в первой группе по итоговым данным граф 2,3 таблицы 5.8 будет равна

Тогда внутригрупповая дисперсия в первой группе будет равна

Расчет показывает, что в первой группе за счет неучтенных факторов-признаков вариация зарплаты составляет 50000 руб2.

Аналогичным образом проведем расчет и по первой группе, которая включает рабочих, имеющих образование (расчет провести самостоятельно). Он даст следующие результаты: средняя зарплата во второй группе будет равна = 2400 руб., а дисперсия - -168750 руб2.

Теперь по формуле 5.19 найдем среднюю из внутригрупповых дисперсий

Найденная средняя из внутригрупповых дисперсий показывает, что зарплата рабочих колеблется под действием неучтенных факторов-признаков в среднем на 97500 руб2.

Теперь по формуле 5.17 определим величину межгрупповой дисперсии, как взвешенную

Расчет показывает, что за счет учета фактора-признака – образование колеблемость зарплаты у рабочих в среднем составляла 240000 руб2. Проверим правильность проведенных расчетов с помощью формулы 5.20, которая устанавливает взаимосвязь общей дисперсии с межгрупповой и внутригрупповой дисперсии

Оценим полученные значения видов дисперсии с помощью эмпирического коэффициента детерминации и коэффициента эмпирического корреляционного отношения.

Эмпирический коэффициент детерминации равен

Он показывает, что доля межгрупповой дисперсии в общей дисперсии равна 0,71 или 71%. А коэффициент эмпирического корреляционного отношения равен

Он показывает, 84,3% колеблемости зарплаты рабочих объясняется действием фактора-признака – образование, а оставшаяся часть колеблемости (15,7%) объясняется действием неучтенных факторов (возраст, квалификация, стаж и т.д.). На основе проведенных расчетов можно сделать вывод: величина зарплаты в первую очередь зависит от уровня образования рабочего.