Статистические группировки, их виды. Определение числа групп и величины интервала группировки

Группировка – один из этапов сложной сводки.

Группировкойназывается распределение единиц изучаемой совокупности на группы по определенным существенным для них признакам, в соответствии со следующим принципом: отличие между единицами одной группы должно быть меньше, чем различия между единицами, попадающими в разные группы.

Важнейший вопрос процесса группировки – это выбор группировочного признака и выделение групп. Группировочным признаком называется признак, по которому поизводится разбивка единиц совокупности на отдельные группы. Его часто называют основанием группировки. Группировочный признак должен быть наиболее существенным из всего их множества. В основу группировки может быть положен как количественный, так и качественный признак. В качестве группировочных могут быть выбраны признаки, являющиеся результатом деятельности или факторами производства (последним отдается предпочтение).

Задачи, которые решаются с помощью метода группировки:

1) выделение социально-экономических типов явлений;

2) изучение структуры явления и структурных сдвигов, происходящих в нем;

3) выявление связи и зависимости между явлениями.

Виды статистических группировок.

I. Типологическая группировка– это разделение разнородной совокупности на отдельные качественно однородные группы и выявление на этой основе экономических типов явлений.

Пример типологической группировки:

Таблица 2.1

Группировка промышленных предприятий одного из регионов России

по формам собственности (данные условные)

№ п/п Группы предприятий по форме собственности Число предприятий
Всего, ед. В % к итогу
Федеральная Муниципальная Частная Смешанная 93,6 0,3 4,9 1,2
  Итого 100,0

II. Структурная группировка – разделение однородной совокупности по какому-либо варьирующему признаку на группы, характеризующие ее структуру.

Пример структурной группировки:

Таблица 2.2

Распределение работников строительной фирмы по уровню доходов (данные условные)

№ п/п Группы работников по уровню доходов, руб. Число работников, чел. Удельный вес числа работников, % к итогу
12500–15000 15000–17500 17500–20000 20000–22500 52,2 26,1 13,0 8,7
  Итого 100,0

Структурная группировка применяется при изучении состава населения по полу, возрасту, месту проживания, уровню доходов; состава предприятий по численности занятых, стоимости основных производственных фондов и т. д.

III. Аналитическая группировка – выявляет взаимосвязи между изучаемыми явлениями и их признаками.

 

 

Пример аналитической группировки:

Таблица 2.3

Группировка коммерческих банков России по сумме активов баланса (данные условные)

№ п/п Группы банков по сумме активов баланса, млн руб. Количество банков, ед. В среднем на один банк
Численность занятых, чел. Чистая прибыль, млрд руб.
До 20000 20000–30000 30000–40000 40000–50000 50000 и более 22,5 31,6 36,0 69,2 205,6
  Итого 60,0

 

1) в основу группировки ставится факторный признак;

2) каждая выделенная группа характеризуется средними значениями результативного признака;

3) с ростом факторного признака возрастает или убывает среднее значение результативного признака.

Группировка бывает простая и сложная.

Простая группировка – группы образованы по одному признаку.

Сложная группировка – группы образованы по двум и более признакам.

Аналитические группировки, построенные по одному признаку, и сложные группировки позволяют установить связь и определить ее направление между результативным и одним – тремя факторными признаками. Но часто этого бывает недостаточно, т.к. в действительности на изменение величины результативного признака оказывает влияние множество факторов, действующих в разных направлениях. Для исследования многофакторных связей используются многомерные группировки. Целью таких группировок является расчленение совокупности социально-экономических явлений на качественно однородные группы по большому числу признаков одновременно и определение на их основе связи и влияния факторных признаков на результативный.

Наряду с группировками, проведенными на основе первичного статистического материала, применяют группировки на основе сгруппированного материала, или вторичные группировки. К ним прибегают в тех случаях, когда проведенные ранее группировки не удовлетворяют целям исследования либо в отношении числа групп, либо с точки зрения сопоставимости данных.

Различают 2 способа образования новых, обычно укрупненных групп:

1) путем изменения интервала первичной группировки;

2) по удельному весу групп в общем итоге.

 

Этапы построения группировки

1-й этап. Определение состава группировочных признаков.

В основу группировки чаще всего ставится факторный признак.

2-й этап. Определение количества групп.

Если группировочный признак атрибутивный (качественный), то всю совокупность делим на столько групп, сколько значений принимает атрибутивный признак.

Если группировочный признак альтернативный (принимает только два значения), то совокупность делим на две группы.

Если группировочный признак количественный, то оптимальное количество групп можно определить по формуле Стерджесса:

где nчисло групп;

N– число единиц совокупности.

Полученную по этой формуле величину n округляют до целого большего числа, поскольку количество групп не может быть дробным числом.

Получаем:

N 15-24 25-44 45-89 90-179

n 5 6 7 8 и т. д.

При небольшом объеме информации (численности единиц в совокупности) число групп может быть установлено исследователем без использования формулы Стерджесса.

3-й этап. Определение интервала группировки.

Интервалы группировки бывают равные и неравные.

Если разбиваем всю совокупность на равные интервалы, то величина каждого интервала определяется по формуле (группировки с равными интервалами применяются в случае небольшой вариации признака и распределении единиц, близком к равномерному):

где – размах вариации;

, – соответственно максимальное и минимальное значения группировочного признака;

h – длина интервала группировки;

n – количество групп.

Величину интервала группировки обычно округляют до целого (всегда большего) числа, исключение составляют лишь случаи, когда изучаются малейшие колебания признака.

Если интервалы неравные, то выделяют следующие виды разбиений:

– прогрессивно возрастающее;

– прогрессивно убывающее;

– произвольное;

– специализированное.

4-й этап. Определение открытых и закрытых интервалов.

Открытые – это те интервалы, у которых указана только одна граница: верхняя – у первого, нижняя – у последнего.

Например: группы работников предприятия по возрасту (лет)

до 25 – открытый интервал;

25–30 – закрытый;

30–40 – закрытый;

40–50 – закрытый;

свыше 50 – открытый.

Открытые интервалы могут быть записаны в виде закрытых, при этом длину открытых интервалов принимаем равной длине соседних с ними интервалов.

В нашем примере, поскольку второй интервал включает 5 единиц (30 – 25 = 5), то длина первого интервала также равна 5, т. е. он от 20 до 25.

Получили: 20–25; 25–30; 30–40; 40–50; 50–60 (верхняя граница последнего интервала 60, т. к. длина предпоследнего интервала 10 единиц).

5-й этап. Распределение единиц совокупности по группам.

 

Пример: Используя метод группировок, провести анализ 30 предприятий одного из регионов России (табл. 2.4), выделив 3 группы предприятий с равными интервалами.

 



Таблица 2.4

Данные о выпуске продукции и прибыли 30 предприятий одного из регионов России (данные условные)

№ п/п Выпуск продукции, млн руб. Прибыль, млн руб.
15,7 18,0 12,1 13,8 15,5 17,9 12,8 14,2 15,9 17,6 18,2 13,0 16,5 16,2 16,7 14,6 14,8 16,1 16,7 15,8 16,4 15,0 16,5 18,5 16,4 16,0 19,1 16,3 19,6 17,2

 

Таблица 2.5

Сортировка предприятий региона на группы по факторному признаку (выпуск продукции)

№ п/п Выпуск продукции, млн руб. Прибыль, млн руб.
12,1
12,8
14,6
13,8
14,2
16,5
14,8
15,7
15,5
15,9
16,2
16,1
15,8
16,4
16,5
16,4
16,3
17,2
17,9
17,6
16,7
16,7
18,5
18,2
19,1
19,6

 

 

1-й этап.Определение группировочного признака

Группировочным признаком должен быть факторный признак, поэтому в основу группировки положим признак «выпуск продукции».

2-й этап. Определение количества групп

Так как в условии задачи задано выделить 3 группы интервалов, то n = 3.

3-й этап. Определение интервала группировки

Так как необходимо построить группировку с равными интервалами, то длину каждого интервала определяем по формуле:

млн руб.

4-й этап. Определение открытых и закрытых интервалов

Так как наибольшее и наименьшее значения группировочного признака известны, то все интервалы закрытые. Нижнюю границу первого интервала принимают равной минимальному значению признака (в нашем примере это значение выпуска продукции, равное 41 млн руб.), верхняя граница первого интервала соответствует значению . Для последующих групп границы определяют аналогично, т. е. последовательно прибавляется величина интервала. Если единица обладает значением признака, равным величине верхней границы интервала, ее следует относить к следующей группе. Получили следующие 3 группы предприятий:

Круглая скобка в конце 1 и 2-го интервалов указывает, что предприятие с выпуском продукции, равным 61 млн руб. нужно включать во вторую группу, а предприятие с выпуском 81 млн руб. – в третью.

5-й этап. Распределение единиц совокупности по группам

Результаты сортировки представлены в табл. 2.5. Принцип заполнения табл. 2.5: сначала из табл. 2.4 выписываем те предприятия, выпуск продукции которых находится в пределах от 41 до 61 млн руб. (их 7), затем предприятия с выпуском от 61 до 81 млн руб. (их 16), и затем предприятия выпуском от 81 до 101 млн руб. (их 7).