Группировки в статистике и их виды
Статистическая группировка – это разделение единиц изучаемой совокупности на качественно однородные группы по значениям одного или нескольких признаков.
Типологические – для выявления экономических, социальных, демографических типов
В типологических группировках применяются специализированные интервалы. Границы интервалов устанавливаются там, где намечается переход от одного
Качества к другому.
Примером типологических группировок могут служить:
- группировка предприятий на прибыльные и убыточные;
- группировка экономически активного населения - на занятых и безработных;
- группировка предприятий по их величине.
Для отнесения единицы совокупности к той или иной группе дается детальное описание свойств, на основе которых формируется группа или устанавливается ценз, то есть числовая граница.
Группировка организаций по финансовому результату за 1 полугодие 2012г.
Тип организаций | Количество организаций, тыс. | Величина прибыли (убытка), млрд. руб. |
прибыльные | 4571,5 | |
убыточные | 706,2 | |
Итого: | 3865,3 |
Разновидностью типологической группировки являются общероссийские классификаторы.
Структурные – для изучения состава совокупности
Например, распределение работников предприятия по стажу работы.
Аналитические – для выявления взаимосвязи между изучаемыми признаками. Единицы совокупности группируются по факторному признаку, а значения результативного показателя приводятся по каждой группе в среднем на единицу совокупности.
Примером аналитической группировки может служить таблица 3.1.
Табл.3.1
Для построения вариационного ряда предварительно составляется ранжированный ряд, то есть ряд, в котором значения признака перечисляются в порядке возрастания или убывания.
Если составляется дискретный вариационный ряд, то варианты перечисляются в порядке возрастания (убывания) и подсчитывается количество единиц, обладающих данным значением признака.
При составлении интервального вариационного ряда определяется: 1. Количество групп;
Устанавливается величина интервалов;
Определяются границы интервалов;
Подсчитывается численность единиц, попадающих в каждую группу.
Единица совокупности, у которой значение признака совпадает со значением границы интервала, включается в группу, в которой это значение соответствует нижней границе.
Следовательно, нижняя граница –включительно, а верхняя – исключительно.
Вариационные ряды могут быть представлены в виде таблиц и графиков.
Табл. 3.1.
Если значения S вычисляются на основе частот, то
Рис. 3. 1. Полигон распределения семей по количеству детей
|
|
|
Пример 2.
Так как объем совокупности небольшой (16 единиц), то образуем 3 группы.
Величина интервалов будет равна:
Округлим величину интервала до целых чисел. Округление производится в большую сторону, чтобы не увеличить количество групп.
Следовательно, величина интервала составит 5 млн. руб.
Минимальное значение выручки 2 млн. руб. Это и будет минимальная (нижняя) граница первого интервала.
Для определения верхней границы этого интервала прибавим к нижней границе величину интервала:
2+5=7
Первый интервал: 2 – 7 (закрытый интервал – интервал, у которого указаны обе границы).
Первый интервал можно записать и так:
до 7 (открытый интервал – интервал, в котором не указана одна из границ).
Признак непрерывный, поэтому нижняя граница второго интервала будет равна верхней границе первого интервала и равна 7.
Верхняя граница второго интервала равна:
7+5=12.
Второй интервал можно записать так:
7 – 12.
Аналогично определяются границы остальных интервалов.
Предприятие с выручкой 7 млн.руб. отнесем во вторую группу, а 12 – в третью группу.
Результаты группировки представим в табл. 3.2.
Табл. 3.2.
Интервальный вариационный ряд с равными интервалами изображается в виде гистограммы распределения и полигона распределения.
Гистограмма распределения вычерчивается в прямоугольной системе координат и представляет собой прямоугольники вплотную расположенные друг к другу. Основания прямоугольников соответствуют величинам интервалов, границы которых указываются по оси абсцисс, а высоты пропорциональны значениям частот.
Табл. 3.2.
В рядах с неравными интервалами установить, какое значение признака встречается наиболее часто, можно по плотности распределения.
Или
ρ – плотность распределения
Интервальный вариационный ряд с неравными интервалами изображается в виде плотности распределения. График строится аналогично гистограмме распределения, однако, по оси ординат откладываются значения плотности.
По данным табл. 3.2 можно построить кумуляту и огиву.
Ряды распределения можно отнести к структурным группировкам.
Вторичная группировка.
Вторичная группировка используется для анализа двух рядов с разными интервалами. Для приведения рядов к сопоставимому виду (одному основанию) используется способ укрупнения интервала и способ пропорционального распределения.
Пример.
Необходимо привести к сопоставимому виду (к одному основанию) группировку организаций по величине выручки.
Величина интервалов в табл. 3.4 должна быть такой, как табл. 3.3.
Табл. 3.3
Группировка организаций по величине выручки
Группы организаций по величине выручки, млн. руб. | Количество организаций |
5-10 | |
10-15 | |
15-20 |
Табл. 3.4
Группировка организаций по величине выручки
Группы организаций по величине выручки, млн. руб. | Количество организаций |
5-7 | |
7-10 | |
10-16 | |
16-20 |
Для первых двух интервалов табл. 3.4 можно использовать способ укрупнения интервалов.
В укрупненный интервал 5 – 10 попадут 6+14=20 организаций.
Для третьего интервала табл. 3.4 целесообразно использовать способ пропорционального распределения.
Верхняя граница третьего интервала 16, а должна быть 15. предполагается, что организации внутри интервала распределяются равномерно. Следовательно, на единицу этого интервала приходится:
= 42/(16-10) = 7 организаций.
Величина интервала должна быть не 6, а 5.
Следовательно, в интервале 10 – 15 должно попасть:
Организаций.
Оставшиеся 7 организаций (42 - 35 = 7) должны перейти в следующую группу.
В последнем интервале должно находиться: 7 + 90 = 97 организаций.
Таблица 3.4 будет преобразована в табл. 3.5.
Табл. 3.5
Группировка организаций по величине выручки
Группы организаций по величине выручки, млн. руб. | Количество организаций |
5-10 | |
10-15 | |
15-20 |