Группировки в статистике и их виды

Группировки в статистике и их виды

Статистическая группировка – это разделение единиц изучаемой совокупности на качественно однородные группы по значениям одного или нескольких признаков.

Типологические – для выявления экономических, социальных, демографических типов

В типологических группировках применяются специализированные интервалы. Границы интервалов устанавливаются там, где намечается переход от одного

Качества к другому.

Примером типологических группировок могут служить:

- группировка предприятий на прибыльные и убыточные;

- группировка экономически активного населения - на занятых и безработных;

- группировка предприятий по их величине.

Для отнесения единицы совокупности к той или иной группе дается детальное описание свойств, на основе которых формируется группа или устанавливается ценз, то есть числовая граница.

Группировка организаций по финансовому результату за 1 полугодие 2012г.

Тип организаций Количество организаций, тыс. Величина прибыли (убытка), млрд. руб.
прибыльные 4571,5
убыточные 706,2
Итого: 3865,3

Разновидностью типологической группировки являются общероссийские классификаторы.

Структурные – для изучения состава совокупности

Например, распределение работников предприятия по стажу работы.

Аналитические – для выявления взаимосвязи между изучаемыми признаками. Единицы совокупности группируются по факторному признаку, а значения результативного показателя приводятся по каждой группе в среднем на единицу совокупности.

Примером аналитической группировки может служить таблица 3.1.

Табл.3.1

Выявление взаимосвязи между баллом по ЕГЭ и экзаменационной отметкой в институте по математике

Ряд распределения - это упорядоченное распределение единиц исследуемой совокупности на группы по одному варьирующему признаку.  

Для построения вариационного ряда предварительно составляется ранжированный ряд, то есть ряд, в котором значения признака перечисляются в порядке возрастания или убывания.

Если составляется дискретный вариационный ряд, то варианты перечисляются в порядке возрастания (убывания) и подсчитывается количество единиц, обладающих данным значением признака.

При составлении интервального вариационного ряда определяется: 1. Количество групп;

Устанавливается величина интервалов;

Определяются границы интервалов;

Подсчитывается численность единиц, попадающих в каждую группу.

Единица совокупности, у которой значение признака совпадает со значением границы интервала, включается в группу, в которой это значение соответствует нижней границе.

Следовательно, нижняя граница –включительно, а верхняя – исключительно.

Вариационные ряды могут быть представлены в виде таблиц и графиков.

Необходимо составить ряд распределения по данным о количестве детей в семье.

Составим ранжированный ряд

Табл. 3.1.

Распределение семей по количеству детей

Если значения S вычисляются на основе частот, то

Если значения S вычисляются на основе частостей, то

Дискретный вариационный ряд изображается в виде полигона распределения. Данный график вычерчивается в прямоугольной системе координат. По оси…     X

Рис. 3. 1. Полигон распределения семей по количеству детей

 
Дискретный вариационный ряд можно изобразить в виде кумуляты распределения. Данный график вычерчивается в прямоугольной системе координат. По оси ординат откладываются накопленные частоты или частости, а по оси абсцисс – варианта. Точки с соответствующими координатами соединяются отрезками прямых линий.

 
S

Пример 2.

Составить вариационный ряд по данным о величине выручки.

Составим ранжированный ряд

Так как объем совокупности небольшой (16 единиц), то образуем 3 группы.

Величина интервалов будет равна:

Округлим величину интервала до целых чисел. Округление производится в большую сторону, чтобы не увеличить количество групп.

Следовательно, величина интервала составит 5 млн. руб.

Минимальное значение выручки 2 млн. руб. Это и будет минимальная (нижняя) граница первого интервала.

Для определения верхней границы этого интервала прибавим к нижней границе величину интервала:

2+5=7

Первый интервал: 2 – 7 (закрытый интервал – интервал, у которого указаны обе границы).

Первый интервал можно записать и так:

до 7 (открытый интервал – интервал, в котором не указана одна из границ).

Признак непрерывный, поэтому нижняя граница второго интервала будет равна верхней границе первого интервала и равна 7.

Верхняя граница второго интервала равна:

7+5=12.

Второй интервал можно записать так:

7 – 12.

Аналогично определяются границы остальных интервалов.

Предприятие с выручкой 7 млн.руб. отнесем во вторую группу, а 12 – в третью группу.

Результаты группировки представим в табл. 3.2.

Табл. 3.2.

Распределение предприятий по величине выручки

Интервальный вариационный ряд с равными интервалами изображается в виде гистограммы распределения и полигона распределения.

Гистограмма распределения вычерчивается в прямоугольной системе координат и представляет собой прямоугольники вплотную расположенные друг к другу. Основания прямоугольников соответствуют величинам интервалов, границы которых указываются по оси абсцисс, а высоты пропорциональны значениям частот.

Можно построить кумуляту распределения

   

Табл. 3.2.

Распределение предприятий по величине выручки

В рядах с неравными интервалами установить, какое значение признака встречается наиболее часто, можно по плотности распределения.

Или

ρ – плотность распределения

Интервальный вариационный ряд с неравными интервалами изображается в виде плотности распределения. График строится аналогично гистограмме распределения, однако, по оси ординат откладываются значения плотности.

По данным табл. 3.2 можно построить кумуляту и огиву.

Ряды распределения можно отнести к структурным группировкам.

Вторичная группировка.

Вторичная группировка используется для анализа двух рядов с разными интервалами. Для приведения рядов к сопоставимому виду (одному основанию) используется способ укрупнения интервала и способ пропорционального распределения.

Пример.

Необходимо привести к сопоставимому виду (к одному основанию) группировку организаций по величине выручки.

Величина интервалов в табл. 3.4 должна быть такой, как табл. 3.3.

Табл. 3.3

Группировка организаций по величине выручки

Группы организаций по величине выручки, млн. руб. Количество организаций
5-10
10-15
15-20

Табл. 3.4

Группировка организаций по величине выручки

Группы организаций по величине выручки, млн. руб. Количество организаций
5-7
7-10
10-16
16-20

Для первых двух интервалов табл. 3.4 можно использовать способ укрупнения интервалов.

В укрупненный интервал 5 – 10 попадут 6+14=20 организаций.

Для третьего интервала табл. 3.4 целесообразно использовать способ пропорционального распределения.

Верхняя граница третьего интервала 16, а должна быть 15. предполагается, что организации внутри интервала распределяются равномерно. Следовательно, на единицу этого интервала приходится:

= 42/(16-10) = 7 организаций.

Величина интервала должна быть не 6, а 5.

Следовательно, в интервале 10 – 15 должно попасть:

Организаций.

Оставшиеся 7 организаций (42 - 35 = 7) должны перейти в следующую группу.

В последнем интервале должно находиться: 7 + 90 = 97 организаций.

Таблица 3.4 будет преобразована в табл. 3.5.

Табл. 3.5

Группировка организаций по величине выручки

Группы организаций по величине выручки, млн. руб. Количество организаций
5-10
10-15
15-20