Понятие группировки

Понятие группировки. Собранный в процессе статистического наблюдения материал нуждается в определенной обработке, сведении разрозненных данных воедино.

Научно организованная обработка материалов наблюдения (по заранее разработанной программе), включающая в себя кроме обязательного контроля собранных данных систематизацию, группировку материалов, составление таблиц, получение итогов и производных показателей (средних, относительных величин), называется в статистике сводкой.

Сводка представляет собой второй этап статистического исследования. Целью сводки является получение на основе сведенных материалов обобщающих статистических показателей, отражающих сущность социально-экономических явлений и определенные статистические закономерности.

Статистическая сводка осуществляется по программе, которая должна разрабатываться еще до сбора статистических данных, практически одновременно с составлением плана и программы статистического наблюдения. Программа сводки включает определение групп и подгрупп; системы показателей; видов таблиц. Группировка – это разбиение совокупности на группы, однородные по какому-либо признаку. С точки зрения отдельных единиц совокупности группировка – это объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам.

Группировочный признак – это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. После определения группировочного признака и границ групп строится ряд распределения. Рядом распределения в статистике называется ряд цифровых показателей, представляющих распределение единиц совокупности по одному существенному признаку, разновидности которого расположены в определенной последовательности.

Процедура определения оптимального числа групп основана на применении формулы Стерджесса: , где n - число групп; N - число единиц совокупности. Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе. Интервалы бывают: - равные, когда разность между максимальным и минимальным значениями в каждом из интервалов одинакова; - неравные, когда, например, ширина интервала постепенно увеличивается, а верхний интервал часто не закрывается вовсе; - открытые, когда имеется только либо верхняя, либо нижняя граница; - закрытые, когда имеются и нижняя, и верхняя границы.

Группировку с равными интервалами строят тогда, когда исследуются количественные различия в величине признака внутри групп одинакового качества, а также если распределение носит более или менее равномерный характер. Величину равного интервала можно вычислить по формуле: , где h - величина равного интервала; xmax, xmin - наибольшее и наименьшее значения признака в совокупности; n - число групп. 1.2.