Выполнение группировки по количественному признаку

При составлении структурных группировок на основе варьирующих количественных признаков необходимо определить, количество групп и интервалы группировок.

Интервал – количественное значение, отделяющее одну группу ( единицу ) от другой, т. е. интервал очерчивает количественные границы групп. Как правило, величина интервала представляет собой разность между максимальным и минимальным значениями признака в каждой группе

Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше интервал, и наоборот. Количество групп зависит от числа единиц исследуемого объекта и степени колеблемости группировочного признака. При небольшом объеме совокупности нельзя образовывать большое число групп, так как группы будут малочисленными или даже пустыми.

При определении количество групп необходимо стремиться к тому, чтобы были учтены особенности изучаемого явления. Поэтому число групп должно быть оптимальным, в каждой группе должно входить достаточно большое число единиц совокупности, что отвечает требованию закона больших чисел.

 
При большом количестве наблюдений количество групп (К) определяют по формуле Стерджесса:

 

(1)

где число единиц совокупности в общем ее объеме.

Результат при таком расчете округляют до целого числа.

Интервалы могут быть равные и неравные, При исследовании экономических явлений могут применяться неравные интервалы. Так, например, по численности работающих промышленные предприятия могут быть разбиты на следующие группы: до 100чел., 100 – 200, 200 – 300, 300 – 500, 500 – 1000, 500 – 100, 1000 и более человек. Это объясняется тем, что количественные изменения размера признака ( численность работающих ) имеют неодинаковые значения в низших и высших по размеру признака группах: изменение количество работающих на 50 – 100 человек имеет существенное значение дл мелких предприятий, а крупных – не имеет.

Группировка с равными интервалами целесообразно в тех случаях, когда вариация проявляется в сравнительно узких границах и распределение является практически равномерным ( например, при группировке рабочих одной профессий по размеру заработной платы, посевов какой – либо культуры по урожайности ).

Для группировок с равными интервалами величина интервала определяется по формуле:

 

, (2)

 

где , наибольшее и наименьшее значения признака.

Интервалы групп могут быть закрытыми, когда указаны нижняя и верхняя границы, и открытыми, когда указана лишь одна из границ.