Важнейшим вопросом теории группировок является выбор группировочных признаков, т. к. от выбора группировочного признака зависят результаты группировки, которые получают в процессе ее разработки. Статистика выделяет следующие основные правила выбора группировочных признаков:
1) при выборе группировочных признаков необходимо руководствоваться знанием сущности данного явления, законов его развития;
2) в основание группировки должно быть положено необходимое число наиболее существенных признаков, отвечающих задачам исследования;
3) группировочные признаки должны отбираться с учетом конкретных особенностей изучаемых явлений;
4) для всесторонней характеристики сложных общественных явлений целесообразно брать несколько группировочных признаков (два или более).
Признаки, положенные в основу группировки, могут быть качественные (атрибутивные) или количественные (имеющие числовое выражение).
При проведении группировок важное значение имеют правильное решение о том, на какое число групп следует подразделять совокупность. Если признак атрибутивный, то число групп, на которое следует подразделять совокупность, определяется числом качественных градаций этого признака. В случае, если группировочный признак количественного порядка, непрерывный или дискретный, с большим размахом вариации, то число групп может быть определено:
1. расчетным путем по формуле: n = 1+3,322 IgN, где n - число групп, N - численность совокупности;
2. по нормативам, а именно: если численность совокупности не превышает 25-30 единиц, то в расчет принимается 3-4 группы, 30-40 - 5-6; 40-60 - 6-8.
При определении числа группировок необходимо их выбор производить таким образом, чтобы каждая группа была представительной, т. е. содержала не менее 7-10 единиц наблюдения, причем центральная часть интервала должна содержать не менее 50%.
Для характеристики групп должны быть образованы интервалы, которые могут быть равные и неравные, открытые и закрытые. При равных интервалах их величина определяется по формуле:
i = (Xmax – Xmin) / n = R / n ; где n - число групп, R - размах вариации.
При построении равных интервалов определяется нижняя и верхняя граница каждого из них, причем считается, что пределы наблюдения могут входить «включительно» или «исключительно». На практике применяются оба метода, но все же предпочтительнее принцип «исключительно».Например, группы работников магазина по производительности труда обозначены следующим образом: до 90 руб.; 90-120; 120-150; 150-180; свыше 180 руб. По принципу «включительно» к первой группе относится работник, производительность труда которого обозначается — до 90 руб.; по принципу «исключительно» этот работник включается во вторую группу—90—120 руб. Применение этих принципов зависит от формы написания интервалов, особенно первой и последней групп. В данном примере работника, производительность которого 180 руб., включают в предпоследнюю группу, поскольку ее интервал обозначен 150—180, а последний—свыше 180 руб. Соответственно работник, имеющий выработку 90 руб., Относится к первой группе. Если бы запись была «180 и более», то по принципу «исключительно» работник, имеющий выработку 180 руб., включался бы в последнюю группу.
Открытые интервалы не имеют для 1-го интервала нижней границы, а для последнего – верхней.
Неравные интервалы могут применяться при значительной вариации признака совокупности. Определяющим при этом является качественная однородность групп. Для характеристики установленных групп и их интервалов необходимо правильное определение показателей, которыми характеризуется каждая группа. При этом выбор показателей должен:
1) отразить общую картину развития экономического процесса;
2) проявить особенности каждого типа;
3) установить специфику проявления типа групп ли формы подгрупп применительно к различным регионам и зонам. Тщательный отбор показателей для анализа позволяет повысить результативность статистической группировки.
Серединное значение интервалов определяется несколькими приемами:
1) Этот показатель можно рассчитать суммированием верхней и нижней границ интервала и делением суммы пополам. В нашем примере во втором интервале середина равна 105 руб. (90+120) :2; в третьем - 135 руб.: (120+150) : 2; в первом интервале - 75 руб. (60+90):2. Поскольку первый интервал является открытым (не имеет нижней границы), а имеющийся ряд распределения – интервальный, причем с равными интервалами (в 30 руб.), то предполагается, что нижней границей первого интервала будет является значение в 60руб. (90 – 30).
2) Эти значения также получают прибавлением к серединному значению второго интервала величины равного интервала (105+30). Вычитая величину равного интервала из серединного значения второго интервала, будем иметь середину первого (105—30), а середина последнего, открытого интервала определяется прибавлением длины интервала к середине интервала из предпоследней группы (165+30=195).