Определение количества выделяемых групп

 

Важнейшим вопросом группировки является определение количества выделяемых групп.

Если в основании группировки лежит атрибутивный признак, то количество выделяемых групп определяется самим этим признаком. Например, производя группировку безработных по полу, выделяют две группы: мужчин и женщин.

Если в основании группировки лежит количественный признак, то производят специальные расчеты для определения количества групп и величин интервалов группировки.

Интервалы определяет количественные границы групп. Как правило, интервал представляет собой промежуток, имеющий нижнюю и верхнюю границы, которые определяют соответственно минимальное и максимальное значения признака в группе.

Величина интервала определяется как разность между максимальным и минимальным значениями признака в группе.

Вопрос о числе групп и величине интервала следует решать с учетом множества обстоятельств, прежде всего исходя из целей исследования, значения изучаемого признака и т.д.

Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше величины интервалов, и наоборот. Количество групп зависит от числа единиц исследуемого объекта и степени колеблемости группировочного признака. При небольшом объеме совокупности нельзя образовывать большое число групп, т. к. группы будут малочисленными.

При определении количества групп необходимо стремится к тому, чтобы были учтены особенности изучаемого явления. Поэтому число групп должно быть оптимальным, в каждую группу должно входить достаточно больное число единиц совокупности, что отвечает требованию закона больших чисел. Однако в отдельных случаях представляют интерес и малочисленные группы: новое, передовое, пока оно не станет массовым, проявляется в незначительном числе фактов. Поэтому задача статистики – выделить эти факты, изучить их.

Таким образом, при решении вопроса о численности единиц в группах нужно руководствоваться не формальными признаками, а знанием сущности изучаемого явления. На количество образуемых групп существенное влияние оказывает степень вариации группировочного признака: чем она больше, тем больше следует образовывать групп.

Ориентировочно оптимальное количество групп с равными интервалами можно определить по формуле американского ученого Стерджесса:

, (3.1) где n – количество образуемых групп;

N – численность единиц (объем) совокупности.

Для определения n при различных значениях N можно воспользоваться табл. 3.4.