Статистическая группировка – это разбиение множества единиц изучаемой совокупности на группы, однородные по какому-либо существенному признаку. С точки зрения отдельных единиц совокупности группировка – это объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам.
Метод группировки основывается на двух категориях – группировочном признаке и интервале.
Группировочный признак – это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Классификация и группировка должны производиться на основании вполне объективных и легко распознаваемых признаков, которые могут носить как атрибутивный, так и количественный характер.
Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе.
Интервалы бывают:
- равные, когда разность между максимальным и минимальным значениями в каждом из интервалов одинакова;
- неравные, когда, например, ширина интервала постепенно увеличивается, а верхний интервал часто не закрывается вовсе;
- открытые, когда имеется только либо верхняя, либо нижняя граница;
- закрытые, когда имеются и нижняя, и верхняя границы.
При формировании группировки с равными интервалами величина интервала определяется по формуле:
где xmax; xmin – наибольшее и наименьшее значение признака;
n – число групп.
Оптимальное число групп с учетом численности совокупности может быть определено по формуле Стерджесса:
где N – число единиц совокупности.
Статистические группировки можно классифицировать по следующим признакам: целям и задачам, числу группировочных признаков, упорядоченности исходных статистических данных (табл. 4).
Таблица 4