Группировка статистических данных и анализ групп

В результате первой стадии статистического исследования — статистического наблюдения — получают сведения о каждой единице совокупности. Задача второй стадии статистического исследования состоит в том, чтобы упорядочить и обобщить первичный материал, свести его в группы и на этой основе дать обобщающую характеристику совокупности. Этот этап в статистике называется сводкой.

Различают простую сводку (подсчет только общих итогов) и статистическую группировку, которая сводится к расчленению совокупности на группы по существенному для единиц совокупности признаку. Группировка позволяет получить такие результаты, по которым можно выявить состав совокупности, характерные черты и свойства типичных явлений, обнаружить закономерности и взаимосвязи.

Результаты сводки могут быть представлены в виде статистических рядов распределения, которыми называют упорядоченное распределение единиц совокупности на группы по изучаемому признаку. В зависимости от признака ряды могут быть вариационными (количественными) и атрибутивными (качественными).

Количественные признаки — это признаки, имеющие количественное выражение у отдельных единиц совокупности, например, заработная плата рабочих, стоимость продукции промышленных предприятий, возраст людей, урожайность отдельных участков посевной площади и т.д.

Атрибутивные признаки — это признаки, не имеющие количественной меры. Например, пол (мужской, женский), отрасль народного хозяйства, вид продукции, профессия рабочего и т.д.

Вариационные ряды могут быть дискретными или интервальными.

Дискретный ряд распределения — это ряд, в котором варианты выражены целым числом.

Примером может служить распределение рабочих по тарифным разрядам:

Таблица 1.18

Тарифный разряд Число рабочих, чел.
1-й
2-й
3-й
4-й
5-й
6-й
Всего:

Интервальный ряд распределения — это ряд, в котором значения признака заданы в виде интервала. Например, распределение рабочих по разрядам можно представить в виде интервального ряда (см. табл. 1.19).

Статистические ряды распределения позволяют систематизировать и обобщать статистический материал. Однако они не дают всесторонней характеристики выделенных групп. Чтобы решить ряд конкретных задач, выявить особенности в развитии явления, обнаружить тенденции, установить зависимости, необходимо произвести группировку статистических данных.

Группировкой называется выделение единиц исследуемой совокупности на однородные группы по определенным, существенным для них признакам.

Таблица 1.19

Тарифный разряд Число рабочих, чел.
1-2-й
3-4-й
5-6-й
Итого:

Группировки могут быть классифицированы по структуре и по содержанию (см. рис. 1.7).

 
 

 

 


Рис. 1.7

Типологическая группировка - это разделение качественно неоднородной совокупности на отдельные качественно однородные группы и выявление на этой основе типовых признаков, то есть группировки, которые характеризуют качественные особенности и различия между типами явлений (см. табл.1.20).

Таблица 1.20

Объем платных услуг населению в РФ по видам услуг в 2008 г., млн. руб.

Вид услуг Объем услуг % к итогу
Жилищно-коммунальные услуги 928439,1 18,53%
Бытовые услуги 406106,9 8,10%
Жилищные услуги 212499,7 4,24%
Коммунальные услуги 715939,4 14,29%
Услуги учреждений культуры 66622,7 1,33%
Туристские услуги 72975,5 1,46%
Физической культуры и спорта 25576,2 0,51%
Медицинские 3,90%
Ветеринарные 7167,6 0,14%
Правового характера 2,04%
Системы образования 287593,8 5,74%
Прочие виды платных услуг 2,87%
Транспортные услуги 875013,5 17,46%
Услуги связи 806670,9 16,10%
Санаторно-оздоровительные 58124,7 1,16%
Услуги гостиниц и анал.средств размещения 107524,3 2,15%
Всего 5011794,3 100,00%

Структурная группировка — это выявление закономерностей распределения единиц однородной совокупности по варьирующим значениям исследуемого признака, то есть это группировка, выявляющая состав (строение, структуру) однородной в качественном отношении совокупности по какому-либо признаку.

Примером могут служить группировки предприятий по: объему деятельности, фондовооруженности, организационно-правовой форме и т.д. Состав населения может быть сгруппирован по полу, по возрасту, по уровню образования, по роду занятий и т.д. Значение такого рода группировок заключается в том, что с их помощью могут быть выделены и изучены показатели группы предприятий: лидеров, средних и отстающих. На основании чего, например, предприятия могут идентифицировать свое положение на рынке. Группировка населения по возрасту, например, необходима для проведения различных расчетов, связанных со страхованием, оказанием услуг, вычисления специальных демографических показателей и т.д.

Структурные группировки отличаются от типологических не столько по внешнему виду, сколько по целям, т. е. отличаются по уровню качественных различий между группами.

Таблица 1.20

Выборка из 57 банков РФ на 2008г.

Группы банков по собственному капиталу Количество % к итогу
     
     
     
     

Аналитическая группировка — это исследование взаимосвязей варьирующих признаков в пределах однородной совокупности (разбиение единиц совокупности на отдельные группы). При ее построении можно установить взаимосвязи между двумя признаками и более. При этом один признак по которому проводится группировка называется группировочным или факторным, а другой (другие) — результативным (ми).

Аналитическая группировка (разбиение единиц совокупности на отдельные группы) проводится на основании группового признака, в качестве которого могут выступать как количественные, так и атрибутивные признаки. Первые имеют числовое выражение (рубли, выработка, объем реализации, возраст, и т. д.), а вторые отражают состояние единицы совокупности (наименование объекта, организационно-правовая форма, отраслевую принадлежность, национальность и т. д.).

Комбинированные группировки. – это образование групп по двум и более признакам, взятым в определенном сочетании. При этом группировочные признаки принято располагать, начиная с атрибутивного, в определенной последовательности, исходя из логики взаимосвязи показателей.

Применение комбинированных группировок обусловлено многообразием экономических явлений, а также необходимостью их всестороннего изучения. При этом следует иметь в виду, что увеличение числа группировочных признаков ограничивается уменьшением наглядности. Примером комбинированной группировки может служить разделение групп предприятиям по организационно-правовым формам, а на подгруппы по уровню рентабельности и/или другим показателям.

Число групп по количественному признаку определяется числом единиц исследуемой совокупности объектов и степенью колеблемости группировочного признака, в каждом отдельном случае его необходимо обосновать. Необходимо учитывать несколько условий: а) число групп детерминируется уровнем колеблемости группировочного признака (чем значительнее вариация признака, тем больше при прочих равных условиях должно быть групп); б) число групп должно отражать реальную структуру изучаемой совокупности; в) не допускается выделение пустых групп. Например, при отсутствии исходной гипотезы, большого числа единиц в совокупности и закону их распределения близкому к нормальному, определить число групп можно математическим путем используя формулу Стерджесса:

n =1 + 3,322 lq N

где n — число групп; N — число единиц совокупности.

Число групп по атрибутивному признаку соответствует количеству атрибутных градаций (например, по полу: мужской, женский; по рассматриваемым организационно-правовая формам: ООО, ОАО, ИЧП и т.д.).

Для установленного числа групп определяются интервалы группировки - значение варьирующего признака, лежащее в границах интервала: нижняя границы (или хотя бы одна из них) это наименьшее значение признака в интервале; верхняя — наибольшее значение признака в интервале. Величина интервала – промежуток между максимальными и минимальными значениями признака в группе (т.е. разность между верхней и нижней границами интервала). Интервалы бывают:

· равные, когда разность между максимальным и минимальным значениями в каждом из интервалов одинакова;

· неравные, когда, например, ширина интервала постепенно увеличивается, а верхний интервал часто не закрывается вовсе;

· закрытые, когда имеются и нижняя, и верхняя границы, например, заработная плата сотрудников определяется в тыс. руб.: 1 - 5; 5 – 10; 10 - 15; 15 – 20; 20 – 30;.

· открытые, когда имеется только либо верхняя, либо нижняя граница, например, заработная плата сотрудников определяется в тыс. руб.: до 3; 3 – 15; 15 – 30; 30 и более.

Интервалы группировки в зависимости от однородности (варьируемости) группировочного признака могут быть равные и неравные.

Если вариация признака проявляется в сравнительно узких границах и ее распределение носит равномерный характер, то группировка проводится с равными интервалами, величина которого определяется:

(1.18)

или

где — xmax и xmin — максимальное и минимальное значения признака в совокупности;

n — число групп.

Если максимальное и минимальное значения (xmax- xmin – размах вариации) существенно отличаются от других единиц группировочного признака, то для определения величины интервала следует использовать не максимальное и минимальное значения, а значения, несколько превышающие минимум и несколько меньшие, чем максимум.

Если размах вариации признака велик и его значения варьируются неравномерно, то необходимо использовать группировку с неравными интервалами.

Применение неравных интервалов обусловлено тем, что первых группах небольшая разница в показателях имеет больше значение, а в последних группах эта разница несущественна. В зависимости от величины размаха вариации, неравные интервалы могут быть прогрессивно возрастающими или прогрессивно убывающими в арифметической (при сильном разбросе данных) или геометрической прогрессии (разброс данных очень сильный).

Величина интервалов, изменяющихся в арифметической прогрессии, определяется следующим образом:

hi+1 = hi + a,

а в геометрической прогрессии:

hi+1 = hi * q,

где a — константа, имеющая для прогрессивно возрастающих интервале знак «+», а для прогрессивно убывающих интервалов знак «-»;

q — константа (для прогрессивно убывающих интервалов q > 1; в другом случае - q< 1).

Например, при анализе заработной платы в группах «разнорабочие», «квалифицированный персонал», «руководители» целесообразно рассматривать неравные интервалы в арифметической прогрессии, а при очень сильной дифференциации – в геометрической.

Интервалы группировок могут быть закрытыми и открытыми. Закрытые имеют верхнею и нижнею границы. У открытых интервалов указана толь одна граница: верхняя — у первого интервала совокупности, нижняя — у последнего. Например, заработная плата сотрудников определяется в тыс. руб.: до 3; 3 – 15; 15 – 30; 30 и более.

Основные этапы построения аналитической группировки:

· обоснование и выбор факторного и результативного признаков;

· группировка единиц совокупности по факторному признаку;

· подсчет числа единиц в каждой из образованных групп, а также определение объема варьирующих признаков в пределах созданных групп;

· исчисление средних размеров результативного показателя (признака) по каждой из образованных групп;

· оформление результатов группировки в таблице;

· сопоставление изменения значений факторного и результативного признаков, определяющее характер связи между ними, т. е. выявление взаимосвязи между признаками, когда с возрастанием значения факторного признака систематически возрастает или убывает значение признака результативного.

Рассмотрим применение метода группировки на примере [ ]. Имеются данные о работе 24 заводов одной из отраслей промышленности (табл.). Непосредственно использовать таблицу для оценки характера распределения заводов, например, по проценту выполнения плана, по числу работающих, по стоимости основных фондов затруднительно. Трудно сказать, какие показатели наиболее характерны для заводов данной отрасли промышленности. Поэтому имеющиеся данные надо привести в систему по интересующему нас признаку.

В качестве изучаемого признака возьмем стоимость основных производственных фондов и построим к нему ряд распределения с равными закрытыми интервалами. Величина интервала определяется по формуле 1.20.

Таблица 1.20

Номер п/п Среднегодовая стоимость ОПФ, млн. руб. Среднесписочное число работающих за отчетный период, чел. Производство продукции за отчетный период, млн. р Выполнение плана, %
3,0 3,2 103,1
7,0 9,6 120,0
2,0 1,5 109,5
3,9 4,2 104,5
3,3 6,4 104,8
2,8 2,8 94,3
6,5 9,4 108,1
6,6 11,9 125,0
2,0 2,5 101,4
4,7 3,5 102,4
2,7 2,3 108,5
3,3 1,3 102,1
3,0 1,4 112,7
3,1 3,0 92,0
3,1 2,5 108,0
3,5 7,9 111,1
3,1 3,6 96,9
5,6 8,0 114,1
3,5 2,5 108,0
4,0 2,8 107,0
1,0 1,6 100,7
7,0 12,9 118,0
4,5 5,6 111,9
4,9 4,4 104,7
Итого¦ 94,1 114,8 -

Образуем пять групп заводов. Тогда величина интервала равна i = (7,0 - 1,0) / 5 = 1,2

Теперь образуем, группы заводов, которые отличаются друг от друга по среднегодовой стоимости основных фондов на эту величину (по табл. 1.21): 1,0 — 2,2 - 3 завода (1,0 + 1,2 = 2,2); 2,2 — 3,4 - 9 заводов (2,2 + 1,2 = 3,4); 3,4 — 4,6 – 5; 4,6 — 5,8 – 3; 5,8 — 7,0 – 4.

На основании этого составляем таблицу, в которой показываем распределение заводов по размеру основных фондов (и удельный вес заводов группы в % к итогу).

Таблица 1.21

Группы заводов по стоимости ОПФ, млн.руб. Число заводов Удельный вес заводов группы в % к итогу
1,0 - 2,2 12,5
2,2 - 3,4 37,5
3,4 - 4,6 20,8
4,6 - 5,8 12,5
5,8 - 7,0 16,7
Итого

По этим данным хорошо видно изменение стоимости основных фондов и легко обозначить границы групп. Видно, что для данной отрасли характерной является группа заводов с основными фондами от 2,2 до 3,4 млн. руб., которая составляет 37,5 % всех заводов, и что более половины заводов (58,3 %) имеют стоимость основных фондов в размере от 2,2 до 4,6 млн.руб.

Теперь перейдем непосредственно к методу группировки. Для этого необходимо выбрать группировочный признак. Выявим данной отрасли промышленности распределение предприятий по мощности, а также влияние этого признака на объем производства. Мощность предприятия в значительной степени определяется размером основных фондов (здания, сооружение, машины, оборудование).

Чтобы выявить распределение предприятий по мощности, необходимо разбить совокупность заводов отрасли на группы по размеру стоимости основных фондов. Выше мы рассматривали построения рядов распределения, были выявлены пять групп.

Составим таблицу с системой показателей, куда занесем результаты группировки заводов по среднегодовой стоимости основных производственных фондов (табл. 1.22).

Таким образом, в отличие от ряда распределения в предшествующей таблице, группировка позволяет сделать конкретные и содержательные выводы. Данная группировка показывает, что наиболее крупные предприятия имеют лучшие производственные показатели. Около 29 % предприятий (группы 4 и 5) имеют 45% всех основных фондов и дают 52% всего объема промышленной продукции, имея лишь 31% общего числа рабочих.

 

Таблица 1.22

    № Группы заводов по среднегод. стоимости ОПФ млн. руб. Заводы Основные производств. фонды Численность рабочих Валовая продукция
    число зав. в % к итогу млн. руб. в % к итогу чел. в % к итогу млн. руб. в % к итогу
I 1,0 - 2,2 12,5 5,0 5,3 9,5 5,6 4,8
II 2,2 - 3,4 37,5 27,4 29,1 35,5 26,5 23,1
III 3,4 - 4,6 20,8 19,4 20,6 22,5 23,0 20,1
IV 4,6 - 5,8 12,5 15,2 16,2 15,0 15.9 13,9
V 5,8 - 7,0 16,7 27,1 28,8 16,5 43,8 38,1
Итого 94,1 114,8

 

Приемы вторичной группировки

Перегруппировка ранее сгруппированных статистических данных называется вторичной группировкой. К этому методу прибегают в тех случаях, когда в результате первоначальной группировки нечетко проявился характер распределения изучаемой совокупности.

В этом случае производят укрупнение или уменьшение интервалов. Также вторичная группировка используется для приведения к сопоставимому виду группировок с различными интервалами с целью их сравнения.

Пример вторичной группировки.

Произвести укрупнение интервалов на основе данных таблицы 1.23:

Таблица 1.23

Группы магазинов по размеру товарооборота за IV квартал, тыс.руб. Число магазинов Товарооборот за IV квартал, тыс.руб.
До 10
10 — 15
15 — 20
20 — 30
30 — 50
50 — 60
60 — 70
70 — 100
100 — 200
Свыше 200
Итого

 

Приведенная группировка недостаточно наглядна, потому что не показывает четкой и строгой закономерности в изменении товарооборота по группам.

Уплотним ряды распределения, образовав шесть групп. Новые группы образованы путем суммирования первоначальных групп (табл.).

Таблица 1.24

Группы магазинов по размеру товарооборота за IV квартал, тыс.руб. Число магазинов Товарооборот за IV квартал, тыс.руб. Товарооборот в среднем на 1 магазин, тыс.руб.
До 10 6,2
10 — 20 14,8
20 — 50 37,1
50 — 100 64,8
100 — 200 109,0
Свыше 200 312,0
Итого 81,6

Совершенно четко видно, чем крупнее магазины, тем выше уровень товарооборота.