Зависимость числа образуемых групп от объема совокупности (по формуле Стерджесса)

N 15 - 24 25 - 44 45 - 89 90 - 179 180 - 359 360 - 719
n

 

Формула Стерджесса пригодна при условии, что распределение единиц совокупности по данному признаку приближается к нормальному и при этом применяются равные интервалы в группах.

Интервалы бывают:

равные, когда разность между максимальным и минимальным значениями в каждом из интервалов одинакова;

неравные, когда, например, ширина интервала постепенно увеличивается, а верхний интервал часто не закрывается вовсе;

открытые, когда имеется только либо верхняя, либо нижняя граница;

закрытые, когда имеются и нижняя, и верхняя границы.

Группировки с равными интервалами применяются в тех случаях, когда вариация признака проявляется в сравнительно узких границах и распределение является практически равномерным. Для группировок с равными интервалами величина интервала (i) определяется по формуле:

, (3.2)

где – соответственно наибольшее и наименьшее значения признака с совокупности;

n – число групп.

Пусть требуется, например, произвести группировку с равными интервалами по данным об уровне месячной заработной платы бюджетных работников, которая колеблется в пределах от 600 до 750 руб., и при этом необходимо выделить 5 групп, то величина интервала составит:

руб.

Если в результате деления при использовании формулы (3.2) получится не целое число и возникает необходимость в округлении, то округлять нужно, как правило, в большую сторону (с избытком), а не в меньшую. В противном случае самое большое значение признака наверняка не попадет в самый высший по размеру признака интервал.

Прибавляя к минимальному значению признака (в данном случае 600 руб.) найденное значение интервала, получаем верхнюю границу первой группы: 600 + 30 = 630.

Прибавляя далее величину интервала к верхней границе первой группы, получаем верхнюю границу второй группы: 630 + 30 = 660 и т.д.

В результате получим такие группы работников по размеру заработной платы, руб.:

600 – 630; 630 – 660; 660 – 690; 690 – 720; 720 – 750.

В этом распределении имеет место неопределенность: к какой группе, например, отнести работника с заработком в 630 руб., к первой или второй? В этом случае можно применить принцип «исключительно», который означает, что значения признака, совпадающие с верхней границей интервала, в этот интервал не включаются, а попадают в следующий интервал. Если же применяется принцип «включительно», то это означает, что значения признака, совпадающие с верхней границей интервала, включаются в этот интервал. Значит работник, получающий 630 руб., должен быть отнесен к первой группе, если применяется принцип «включительно», и ко второй, если применяется принцип «исключительно». Разумеется, что для группировки определенной совокупности применяется только один из указанных принципов.

При исследовании экономических явлений могут применяться неравные (прогрессивно возрастающие, прогрессивно убывающие) интервалы. Например, по численности работающих промышленные предприятия могут быть разбиты на следующие группы до 100 человек, 100 – 200, 200 – 300, 300 – 500, 500 – 1000, 1000 и более человек. Это объясняется тем, что количественные изменения размера признака имеют неодинаковые значения в низших и высших по размеру признака группах: изменение количества работающих на 50 – 100 человек имеет существенное значение для мелких предприятий, а для крупных – не имеет.

Открытыми могут быть первый или последний интервалы. При этом, величины открытых интервалов принимаются равными величинам смежных с ними интервалов.

После определения группировочного признака, количества групп и интервалов группировки данные сводки и группировки представляются в виде рядов распределения и оформляются в виде таблиц.