Виды дисперсий и правила их сложения

Если статистическая совокупность разбита на группы по како­му-либо признаку и для этих групп известны (или могут быть най­дены) средний уровень и дисперсия, то нередко при объединении частных групп в совокупность требуется оценить вариации пока­зателей объединенной совокупности на основе показателей от­дельных частных групп. При этом необходимо учитывать, что вариация признака в целом по совокупности зависит как от вари­ации признака внутри каждой группы, так и от вариации группо­вых средних, т.е. от межгрупповой вариации признака. Другими словами, общую дисперсию s2о6щ, характеризующую вариацию признака под влиянием всех факторов, можно получить на основе ее составляющих - межгрупповой и внутригрупповой дисперсий.

Пусть исходная совокупность делится на m однородных групп по одному признаку-фактору.

Допустим, имеется распределение исходной совокупности, представленное в нижеприведенной таблице.

Распределение исходной совокупности по группам

 

Значение признака xi Число единиц в j-й группе Итого
k
x1 x11 x12 x1k f1+ s1+…+ t1=n1
х2 x21 x22 x2k f2+ s2+…+ t2=n2
хk xk1 xk2 xkk fk+ sk+…+ tk=nk
Итого N1 N2 Nm N

Сначала вычисляем m частных средних, т.е. среднее значение признака в каждой группе:

, , …,

На основе частных средних определяем обитую среднюю по формуле

где

Общая дисперсия совокупности

Общая дисперсия отражает вариацию признака за счет всех ус­ловий (факторов), действующих в данной совокупности.

Вариацию между группами за счет признака-фактора, положенного в основу группировки, отражает межгрупповая дис­персия, которая исчисляется по отклонениям групповых средних от общей средней:

Вариацию внутри каждой группы изучаемой совокупности отражает частная групповая дисперсия, которая исчисляется как средний квадрат отклонений значений признака х от частной средней .

, , ….,

Так как изучаемая совокупность разбита на несколько групп, то для всей совокупности внутригрупповую вариацию будет вы­ражать внутригрупповая дисперсия, которая рассчитывается как средняя арифметическая из групповых дисперсий:

Вид дисперсии Формула для расчета Характеристика
общая дисперсия отражает вариацию признака за счет всех ус­ловий (факторов), действующих в данной совокупности
межгрупповая дис­персия отражает вариацию между группами за счет признака-фактора, положенного в основу группировки
средняя из внутригрупповых дисперсий отражает случайную вариацию, обусловленную неучтенными факторами и не зависящая от признака-фактора, положенного в основание группировки

k - число групп;

fj – число единиц в j-ой группе;

- частная средняя по j-ой группе;

- общая средняя по совокупности единиц.

- внутригрупповая дисперсия

Между представленными видами дисперсий существует опре­деленное соотношение: общая дисперсия равна сумме дисперсий внутригрупповой (средней из групповых дисперсий) и межгруп­повой (дисперсии частных средних), т.е.

Общая дисперсия = Межгрупповая дисперсия + Средняя из внутригрупповых дисперсий
s2 = d2x +

Правило сложения дисперсии позволяет выявить зависимость результата от определяющих факторов с помощью соотношения межгрупповой дисперсии и общей дисперсии. Это соотношение называется эмпирическим коэффициентом детерминации:

Показывает, какая доля в общей дисперсии приходится на дисперсию, обусловленную вариацией признака, положенного в основу группировки.

Корень квадратный из эмпирического коэффициентом детерминации называется эмпирическим корреляционным отношением:

Отражает влияние признака, положенного в основание группировки, на вариацию результативного признака. hÎ[0;1]. При этом если h =0, то группировочный признак не оказывает влияние на результативный. Если h =1, то результативный признак изменяется только в зависимости от признака, положенного в основание группировки, а влияние прочих факторов равно нулю.

Для проверки существенности связи между группировочным признаком и вариацией исследуемого признака часто используется дисперсионное отношение или F-критерий Фишера:

v1 и v2 - число степеней свободы для сравниваемых дисперсий, при этом: v1=m-1; v2=N-m

m – число групп

N – число наблюдений

Полученное значение критерия, называемое фактическим (расчетным) сравнивают табличным (критическим) значением которое определяется по таблице в зависимости от степеней свободы.

Если Fфакт > Fтабл наличие связи доказано.