Если статистическая совокупность разбита на группы по какому-либо признаку и для этих групп известны (или могут быть найдены) средний уровень и дисперсия, то нередко при объединении частных групп в совокупность требуется оценить вариации показателей объединенной совокупности на основе показателей отдельных частных групп. При этом необходимо учитывать, что вариация признака в целом по совокупности зависит как от вариации признака внутри каждой группы, так и от вариации групповых средних, т.е. от межгрупповой вариации признака. Другими словами, общую дисперсию s2о6щ, характеризующую вариацию признака под влиянием всех факторов, можно получить на основе ее составляющих - межгрупповой и внутригрупповой дисперсий.
Пусть исходная совокупность делится на m однородных групп по одному признаку-фактору.
Допустим, имеется распределение исходной совокупности, представленное в нижеприведенной таблице.
Распределение исходной совокупности по группам
Значение признака xi | Число единиц в j-й группе | Итого | |||
… | k | ||||
x1 | x11 | x12 | … | x1k | f1+ s1+…+ t1=n1 |
х2 | x21 | x22 | … | x2k | f2+ s2+…+ t2=n2 |
… | … | … | … | … | … |
хk | xk1 | xk2 | … | xkk | fk+ sk+…+ tk=nk |
Итого | N1 | N2 | … | Nm | N |
Сначала вычисляем m частных средних, т.е. среднее значение признака в каждой группе:
, , …,
На основе частных средних определяем обитую среднюю по формуле
где
Общая дисперсия совокупности
Общая дисперсия отражает вариацию признака за счет всех условий (факторов), действующих в данной совокупности.
Вариацию между группами за счет признака-фактора, положенного в основу группировки, отражает межгрупповая дисперсия, которая исчисляется по отклонениям групповых средних от общей средней:
Вариацию внутри каждой группы изучаемой совокупности отражает частная групповая дисперсия, которая исчисляется как средний квадрат отклонений значений признака х от частной средней .
, , ….,
Так как изучаемая совокупность разбита на несколько групп, то для всей совокупности внутригрупповую вариацию будет выражать внутригрупповая дисперсия, которая рассчитывается как средняя арифметическая из групповых дисперсий:
Вид дисперсии | Формула для расчета | Характеристика |
общая дисперсия | отражает вариацию признака за счет всех условий (факторов), действующих в данной совокупности | |
межгрупповая дисперсия | отражает вариацию между группами за счет признака-фактора, положенного в основу группировки | |
средняя из внутригрупповых дисперсий | отражает случайную вариацию, обусловленную неучтенными факторами и не зависящая от признака-фактора, положенного в основание группировки |
k - число групп;
fj – число единиц в j-ой группе;
- частная средняя по j-ой группе;
- общая средняя по совокупности единиц.
- внутригрупповая дисперсия
Между представленными видами дисперсий существует определенное соотношение: общая дисперсия равна сумме дисперсий внутригрупповой (средней из групповых дисперсий) и межгрупповой (дисперсии частных средних), т.е.
Общая дисперсия = | Межгрупповая дисперсия + | Средняя из внутригрупповых дисперсий |
s2 = | d2x + |
Правило сложения дисперсии позволяет выявить зависимость результата от определяющих факторов с помощью соотношения межгрупповой дисперсии и общей дисперсии. Это соотношение называется эмпирическим коэффициентом детерминации:
Показывает, какая доля в общей дисперсии приходится на дисперсию, обусловленную вариацией признака, положенного в основу группировки.
Корень квадратный из эмпирического коэффициентом детерминации называется эмпирическим корреляционным отношением:
Отражает влияние признака, положенного в основание группировки, на вариацию результативного признака. hÎ[0;1]. При этом если h =0, то группировочный признак не оказывает влияние на результативный. Если h =1, то результативный признак изменяется только в зависимости от признака, положенного в основание группировки, а влияние прочих факторов равно нулю.
Для проверки существенности связи между группировочным признаком и вариацией исследуемого признака часто используется дисперсионное отношение или F-критерий Фишера:
v1 и v2 - число степеней свободы для сравниваемых дисперсий, при этом: v1=m-1; v2=N-m
m – число групп
N – число наблюдений
Полученное значение критерия, называемое фактическим (расчетным) сравнивают табличным (критическим) значением которое определяется по таблице в зависимости от степеней свободы.
Если Fфакт > Fтабл наличие связи доказано.