Определение тесноты связи между факторами. Правило сложения дисперсий

Если некоторая совокупность единиц делится на группы, то наряду с общей дисперсией может быть рассчитана дисперсия по отдельным группам (групповая или частная), а также средняя из групповых и межгрупповая дисперсия.

Групповые дисперсии характеризуют колеблемость признака, обусловленную причинами, действующими внутри каждой группы. Групповые дисперсии вычисляются как средний квадрат отклонений значения признака внутри групп от групповой средней. (i -номер группы):

 

Средняя из групповых дисперсий характеризует величину вариации, которая вызвана любыми факторами, кроме фактора, положенного в основание группировки. Вычисляется по формуле средней арифметической взвешенной из групповых дисперсий:

 

где i – номер группы.

Межгрупповая дисперсия выражает вариацию признака, обусловленную фактором, положенным в основание группировки. Межгрупповая дисперсия равна среднему квадрату отклонений групповых средних от общей средней:

 

где i номер группы,

− групповые средние,

− общая средняя, вычисляется по формуле:

 

Общая дисперсия характеризует вариацию признака, которая зависит от всех факторов или всех условий данной совокупности. Она складывается из средней из групповых и межгрупповой дисперсии:

 

Эта формула выражает собой правило сложения дисперсий.

Изучение влияния факторов по их дисперсиям называется дисперсионным анализом.

Это статистический метод анализа результатов наблюдения, зависящих от различных одновременно действующих факторов. Этот метод обеспечивает выбор наиболее важных факторов и оценку их влияния.

С целью изучения тесноты связи между факторами в дисперсионном анализе рассчитывают коэффициент детерминации и эмпирическое корреляционное отношение.

Коэффициент детерминации показывает, какая доля всей вариации обусловлена фактором, положенным в основание группировки, и равняется отношению межгрупповой дисперсии к общей:

 

Эмпирическое корреляционное отношение равно корню из коэффициента детерминации:

 

Оно показывает тесноту связи между признаками. Для более качественной оценки тесноты связи пользуются следующей таблицей:

 

Η 0,1-0,3 0,3-0,5 0,5-0,7 0,7-0,9 0,9-0,99
Сила связи слабая умеренная или незначительная заметная тесная весьма тесная

 

Пример 1 Для изучения взаимосвязи между стажем работы и производительностью труда произведена следующая группировка рабочих:

 

Группа № Группы рабочих по стажу, лет Число рабочих, чел. Среднечасовая выработка продукции 1 рабочего, шт.
До 3 2 2 3 3 4
3-5 2 2 3 3 3 3 3 4 4 4 4 4 4 4 4
ИТОГО:    

Вычислить:

1 среднечасовую выработку продукции по каждой группе и по двум вместе;

2 дисперсию по каждой группе и среднюю из групповых;

3 межгрупповую дисперсию;

4 общую дисперсию по правилу сложения дисперсий;

5 коэффициент детерминации;

6 эмпирическое корреляционное отношение.

Сделать выводы о тесноте и наличии связи.

Для решения задачи построим по каждой группе рабочих ряды распределения по выработке.

Первая группа:

 

Выработка, шт Х Число рабочих, чел. f        
-0,8 0,64 1,28
0,2 0,04 0,08
1,2 1,44 1,44
Итого: - - 2,80
             

 

14/5=2,8 (шт)

Вторая группа:

 

Выработка, шт Х Число рабочих, чел. f        
-1,4 1,96 3,92
-0,4 0,16 0,80
0,6 0,36 2,88
Итого: - - 7,60

 

51/15=3,4 (шт)

Общая средняя:

(2,8·5+3,4·15)/20=3,25 (шт)

Найдем групповые или внутригрупповые дисперсии:

 

 

Найдем среднюю из групповых дисперсий:

 

Межгрупповая дисперсия:

 

Общая дисперсия:

 

Коэффициент детерминации:

 

Это означает, что изменение среднечасовой выработки обусловлено вариацией стажа лишь на 11,5%.

Эмпирическое корреляционное отношение:

 

Вывод: Связь между стажем и выработкой незначительная.