Принципы построения группировки

Принципы построения группировки. При построении группировки следует придерживаться следующей схемы: 1) выбирают группировочный признак или комбинацию признаков; 2) определяют число групп и величину интервала; 3) непосредственно группируют статистические данные; 4) составляют таблицу или графическое отображение, в которых представляют результаты группировки; 5) делают вывод.

Для определения оптимального числа групп используют формулу Стерджесса : n = 1 + 3,322*lgN , (1.1) где n – число групп, N – число единиц совокупности. Другой способ определения числа групп основан на применении среднего квадратичного отклонения ( ). Если величина интервала 0,5 то совокупность разбивается на 12 групп, когда величина интервала 2/3 и, то совокупность делится соответственно на 9 и 6 групп.

Если совокупность делится на 12 групп, то интервалы строятся в промежутке (x-3; x+3) с шагом 0,5 , если на 6 групп, то интервалы строятся в том же промежутке с шагом. Среднее квадратичное отклонение рассчитывается по формуле: (xi-x)2 , n (1.2) где xi- i-е значение варьирующего признака, x- среднее значение признака по совокупности, которое находится по формуле: xi n (1.3) Интервалы могут быть равными и неравными.

Если вариация признака проявляется в сравнительно узких границах, и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле: xmax - xmin, n (1.4) где xmax и xmin- максимальное и минимальное значение признака в совокупности. Интервал, у которого обозначены обе границы, называют закрытым, а интервал, у которого указана только одна граница (верхняя или нижняя) – открытым.

Неравные интервалы применяются в статистике, когда значения признака варьируются неравномерно и в значительных размерах, что характерно для большинства социально- экономических явлений, особенно на макроэкономическом уровне. Неравные интервалы могут быть прогрессивно возрастающими и убывающими в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической прогрессии, определяются следующим образом: hi+1 = hi + a , (1.5) в геометрической прогрессии: hi+1 = hi*q , (1.6) где a – константа – число, которое будет положительным при прогрессивно возрастающих интервалах и отрицательным – при прогрессивно убывающих интервалах; q – константа – положительное число, которое при прогрессивно возрастающих интервалах будет больше 1, а при прогрессивно убывающих – меньше 1. При изучении социально-экономических явлений на макроуровне часто применяют группировки с произвольными интервалами.

Произвольные интервалы используют при группировке рабочих по выработке продукции, предприятий – по уровню рентабельности.

Для построения группировки с произвольными интервалами используют коэффициент вариации: V = x/ *100% . (1.7) Всю совокупность выстраивают в порядке возрастания или убывания варьирующего признака, а затем берут первые значения ряда до тех пор, пока коэффициент вариации не будет равен 33%. Это будет свидетельствовать об образовании первой группы, которая исключается из исходной совокупности.

Оставшаяся часть принимается за новую совокупность, для которой повторяется алгоритм образования первой группы. И так до тех пор, пока все единицы совокупности не будут объединены в группы. Особенностью данной группировки является то, что до проведения группировки исследователь не знает ни количества групп, ни величины интервалов. 1.4.