Сводка и группировка статистических данных

 

Статистическая группировка – это разбиение множества единиц изучаемой совокупности на группы, однородные по какому-либо существенному признаку. С точки зрения отдельных единиц совокупности группировка – это объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам.

Метод группировки основывается на двух категориях – группировочном признаке и интервале.

Группировочный признак – это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Классификация и группировка должны производиться на основании вполне объективных и легко распознаваемых признаков, которые могут носить как атрибутивный, так и количественный характер.

Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе.

Интервалы бывают:

- равные, когда разность между максимальным и минимальным значениями в каждом из интервалов одинакова;

- неравные, когда, например, ширина интервала постепенно увеличивается, а верхний интервал часто не закрывается вовсе;

- открытые, когда имеется только либо верхняя, либо нижняя граница;

- закрытые, когда имеются и нижняя, и верхняя границы.

При формировании группировки с равными интервалами величина интервала определяется по формуле:

где xmax; xmin – наибольшее и наименьшее значение признака;

n – число групп.

 

Оптимальное число групп с учетом численности совокупности может быть определено по формуле Стерджесса:

где N – число единиц совокупности.

 

Статистические группировки можно классифицировать по следующим признакам: целям и задачам, числу группировочных признаков, упорядоченности исходных статистических данных (табл. 4).

Таблица 4