Группировка статистических данных

 

Собранный в процессе статистического наблюдения первичный материал нуждается в определенной обработке. Цель этой обработки – систематизация данных, подведение итогов в виде обобщающих показателей, установление наиболее общих закономерностей в изучаемом материале. Одним из эффективных способов такой обработки является группировка. В ходе группировки пытаются всю изучаемую статистическую совокупность разбить на части, называемые группами. Этим достигается выделение однородных частей, имеющих свои особенности, и изучение соотношения между этими частями (анализ структуры совокупности), изучение изменений, происходящих во времени. Таким образом, группировка – это процесс разбиения статистической совокупности на группы, однородные в отношении какого-либо признака, либо имеющие близкие значения группировочного признака.

Метод группировок основан на выделении, в первую очередь, группировочного признака. Группировочный признак – это признак, по величине или по значениям которого происходит объединение отдельных единиц совокупности в однородные группы.

Второй важный момент при проведении группировки – определение числа интервалов и их границ. Весь диапазон изменения группировочного признака при проведении группировки должен быть разбит на интервалы. Каждая выделенная группа имеет минимальное и максимальное значение признака, разница между которыми и образует интервал.

Обычно в статистике используются два основных подхода к образованию интервалов:

1. Равные интервалы группировки, когда разность между максимальным и минимальным значением группировочного признака во всех группах совершенно одинакова.

2. Неравные интервалы.

Первый подход используется, когда общая вариация группировочного признака невелика, значения изучаемого признака равномерно распределены между минимальным и максимальным значениями признака. Равные интервалы удобны, когда предполагается какая-либо последующая математическая обработка результатов группировки. Неравные интервалы предпочтительны, когда вариация группировочного признака очень велика (табл. 1).

Таблица 1

Группировка предприятий по числу работающих

Группы предприятий по числу работающих, человек Доля предприятий в процентах к итогу
до 100
100-200
200-500
500-1000
1000-5000
5000-10000
более 10000
Всего

 

Общее число групп или интервалов определяется исследователем самостоятельно, исходя из особенностей изучаемых данных или целей проведения группировки. В случае качественного группировочного признака количество групп может определяться количеством различных значений признака.

В случае количественного признака при равной ширине всех интервалов число их может быть определено по формуле Стерджесса К = 1 + 3.32×lg n, где К – число интервалов, n – количество наблюдений.

 

Классификация и назначение группировок

Статистические группировки в зависимости от цели проведения делятся на три вида:

1. Типологическая группировка. Решает задачу выявления и характеристики социально-экономических типов. Для типологической группировки не являются произвольным ни выбор группировочного признака, ни установление числа интервалов и их границ. Выделение групп (типов) производится на основании одного или нескольких существенных признаков, в результате тщательного теоретического и логического анализа. Обычно выделенные типы устойчивы на протяжении длительного периода времени. В качестве примеров типологической группировки может быть рассмотрено разделение общества на классы, деление предприятий на группы по форме собственности, разделение работающих на работников физического и умственного труда. Выделив в типологической группировке социально-экономические типы, можно затем анализировать соотношение между ними и изменение во времени, сравнивать между собой значения различных признаков по выделенным группам и делать выводы по результатам этого сравнения.

2. Структурная группировка. Позволяет описать соотношение между выделенными группами в едином целом и проследить структурные сдвиги, происходящие в изучаемой совокупности во времени. При построении структурной группировки обязателен показатель численности групп, представленный частотой (количество объектов в группе) либо удельным весом каждой группы. Пример структурной группировки, отражающей изменение структуры во времени, представлен в таблице 2.

Таблица 2