Правило сложения дисперсий

Для сгруппированной статистической совокупности возможно вычисление 3 видов дисперсий: общей, межгрупповой и внутригрупповой.

Общая дисперсия измеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значений признака х от общей средней и может быть вычислена как простая или взвешенная дисперсия.

Межгрупповая дисперсия характеризует систематическую вариацию, обусловленную влиянием факторного признака, положенного в основание группировки. Она равна среднему квадрату отклонений групповых (частных) средних от общей средней:

.

Внутригрупповая (частная) дисперсия отражает случайную вариацию, т.е. вариацию, обусловленную влиянием неучтенных факторов и не зависящую от факторного признака, положенного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы (х) от средней арифметической этой группы, (групповой средней) и может быть исчислена как простая или как взвешенная дисперсия по формулам:

простая взвешенная

Между всеми указанными дисперсиями существует взаимосвязь, которая называется правилом сложения дисперсий – общая дисперсия равна сумме средней из внутригрупповых дисперсий и межгрупповой дисперсии:

.

Пользуясь правилом сложения дисперсий, можно всегда по двум известным дисперсиям определить третью неизвестную, а также судить о силе влияния группировочного признака. Чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние группировочного признака на изучаемый признак.

В связи с этим в статистическом анализе широко используется эмпирический коэффициент детерминации () – показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии результативного признака:

.

Он принимает значения от 0 до 1 и показывает долю вариации результативного признака у под влиянием факторного признака х (остальная часть общей вариации у обуславливается вариацией прочих факторов).

Например, пусть х – разряд рабочего, у – производительность труда, а =0,66 или 66%, тогда это означает, что на 66% вариация производительности труда рабочих обусловлена различиями в их квалификации и на 34% - случайными факторами.

Корень квадратный из эмпирического коэффициента детерминации называется эмпирическим корреляционным отношением:

.

Оно также может принимать значения от 0 до 1. С его помощью оценивают тесноту связи между факторным и результативным признаком: чем ближе корреляционное отношение к 1, тем теснее связь между признаками.