Этапы построения статистической группировки

Группировка статистических материалов осуществляется в несколько этапов.

1. Выбор группировочного признака. Для того, чтобы осуществлять группировку, необходимо из множества признаков выбрать определяющий, который полно и точно характеризует расматриваемое явление. Все признаки, на основе которых могут проводиться группировки можно объединить в следующие группы:

а) по форме выражения группы могут быть атрибутивные (по полу) и количественные (объем выпуска продукции за ряд лет). Количественные делятся на дискретные – значения которых могут быть только целые числа, и непрерывные – значения которых любые числа, даже дробные.

б) по характеру колеблемости группового признака выделяют альтернативные, т.е. признаки, которыми одни единицы обладают, а другие нет; и имеющие множество количественных значений.

в) по роли играющего взаимосвязи явления – факторные и результативные, причем один и тот же признак может быть и тем и другим.

2. Распределение единиц совокупности по группам. Важным моментом на этом этапе является выбор оптимального числа групп. Количество групп зависит от того, какой признак положен в основу группировки. Если группировка осуществляется по атрибутивному признаку, то число групп принимается равным числу значений этого признака (группировка по полу). Аналогично осуществляется группировка по дискретному признаку при незначительном числе его значений, но во всех остальных случаях определение числа групп требует специальных расчетов. Если используется многомерная группировка, то определение числа групп осуществляется при помощи кластерного анализа.

3.Определение величины интервала. Интервал – промежуток между двумя значениями количественного признака, в пределах которого все значения признака относятся к данной группе. Величина интервала зависит от количества групп (чем больше групп, тем меньше интервал). Интервалы бывают равными и неравными. Равные интервалы имеют одинаковые границы во всех группах.

Для определения количества групп группировки с равными интервалами может быть использована формула Стерджесса: