рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Значение и сущность группировки. Построение группировки

Значение и сущность группировки. Построение группировки - раздел Математика, СТАТИСТИКА. КУРС ЛЕКЦИЙ Изучаемые Статистикой Массовые Явления И Процессы Протекают В Множествах Элем...

Изучаемые статистикой массовые явления и процессы протекают в множествах элементов (единиц) некоторого вида, или совокупностях. Определить совокупность – значит определить входящие в нее элементы, т.е. единицы. Структура совокупности показывает, как единицы разграничиваются друг с другом, т.е. под структурой понимается характер распределения единиц совокупности для каждого признака и характер взаимосвязи признаков между собой.

В простейших случаях явление протекает в одной совокупности. В более сложных в рамках самой совокупности существуют качественно различные частные совокупности, без разграничения которых невозможно разобраться в массовом явлении. Так, если единицей совокупности «Пищевая промышленность» является предприятие, то в составе предприятия действуют совокупности рабочих, станков. Состав совокупности по таким качественно различным частям, играющим разную роль в исследуемом массовом явлении, представляет собой одну из важнейших характеристик структуры этой совокупности.

Каждая совокупность должна объединять качественно однородные элементы, играющие в рассматриваемом массовом явлении вполне определенную роль. Игнорирование качественных различий ведет к грубым ошибкам.

В изучении массового явления необходимо, прежде всего, определить действующие в нем качественно однородные совокупности. Это первое основное требование научной методологии в статистике. Выделение и анализ однородных подсовокупностей выполняют с помощью методов группировки.

Таким образом, мы записываем определение. Группировка - это распределение единиц совокупности по группам в соответствии со следующим принципом: различия между единицами, отнесенными к одной группе, должны быть меньше, чем между единицами, отнесенными к разным группам.

Группировка лежит в основе дальнейшей работы с собранной информацией. На основе группировок рассчитываются сводные показатели по группам, появляется возможность их сравнения, анализа причин различий между группами, изучение взаимосвязей между признаками. Если рассчитывать сводные показатели только по совокупности в целом, то мы не сможем уловить её структуры, роли отдельных групп, их специфики.

Таким образом, значение группировки состоит в том, что этот метод обеспечивает обобщение данных, представление их в компактном виде. Кроме того, группировка создает основу для последующей сводки и анализа данных.

Сводные показатели для отдельных групп являются типичными и устойчивыми, если, во-первых, группировка проведена правильно, во-вторых, группы имеют достаточную численность. При достаточно большом числе единиц (не менее 5 в группе) в сводных показателях взаимопогашаются случайные характеристики и проявляются закономерные, типичные.

Для построения группировки необходимо установить правила отнесения каждой единицы к той или иной группе. Эти правила включают в себя, во-первых, определение группировочных признаков - это характеристики (признаки), по которым происходит объединение отдельных единиц совокупности в однородные группы. Его часто называют основанием группировки. Во-вторых, определить интервалы группировки, т.е. значение характеристик, которые будут отделять одну группу от другой.

В качестве основания группировки следует использовать существенные признаки. В каждом конкретно исследовании он будет свой, в зависимости от целей исследования.

В основании группировки могут быть положены как количественные, так и качественные признаки. Количественные имеют численное выражение (объем торгов, курс доллара в рублях, возраст человека, денежный доход семьи и т.д.), а качественные отражают состояние единицы совокупности (пол человека, его национальную принадлежность, семейное положение, отраслевая принадлежность предприятия, его форма собственности и организационно-правовая форма и т.д.)

После определения основания группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупности, степени вариации признака.

Единицы совокупности могут быть разбиты на разное число групп по одному и тому же признаку. Например, при группировке населения по возрасту с целью определения трудовых ресурсов страны все население в практической статистике делится на три группы: население моложе трудоспособного возраста, трудоспособное население и население старше трудоспособного возраста. Если же анализируется продолжительность жизни, то строится более детальная группировка, и выделяются пятигодичные группы.

При построении группировки по качественному признаку групп, как правило, будет столько, сколько будет градаций, видов, состояний у этого признака. Например, в случае проведении группировки населения по полу можно образовать только две группы: мужчины и женщины. Если проводится группировка производства товаров народного потребления по экономическим районам, то вся совокупность делится на 11 групп: именно на столько районов поделена территория страны.

При небольшом объеме совокупности не следует образовывать большое число групп, так как группы будут слишком малочисленны, что не позволит получить верные характеристики исследуемого явления. (Минимальное число единиц в группе должно быть не меньше 5).

Одним из способов определения числа групп является использование формулы Стерджесса. Мы говорили о ней при построении вариационных рядов. Эта формула имеет вид: k = 1 + 3,322 lg n, где к - число групп, n - число единиц совокупности. Мы видим, что выбор числа групп по этой формуле зависит от объема совокупности.

Недостатком этой формулы состоит в том, что её применение дает хорошие результаты, если совокупность состоит из большого числа единиц.

Другой способ основан на применении показателя среднего квадратичного отклонения (σ). Если принять величину интервала равной 0,5σ, то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3σ и σ, то совокупность делится соответственно на 9 и 6 групп. Если 12 групп, то интервалы строятся следующим образом:

1 - - 3,0 σ - 2,5 σ

2 - - 2,5 σ - 2,0 σ

……………………………

7 - + 0,5 σ

8 - + 0,5 σ + 1,0 σ

………………………………

12 - +2,5 σ + 3,0 σ, где среднее значение признака, определяемое как среднее арифметическое, σ - среднее квадратическое отклонение. Но все равно эти методы не дают гарантии в том, что не будут сформированы "пустые" или малочисленные группы. Наличие таких интервалов свидетельствует, что группировка построена неверно.

После определения числа групп следует определить интервалы группировки.

Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе. Интервалы бываю:

§ равные, когда разность между максимальным и минимальным значениями в каждом из интервалов одинакова;

§ неравные, когда например, ширина интервала постепенно увеличивается, а верхний интервал не закрывается вовсе;

§ открытые, когда имеется либо верхняя, либо нижняя граница;

§ закрытые, когда имеются и нижняя, и верхняя границы.

Интервал - это значение варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну их них. Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в нем. Величина интервала - разность между верхней и нижней границами интервала.

Определение интервала группировки. Существует следующие виды интервалов - открытые и закрытые. Открытые интервалы - это интервалы, у которых указывается верхняя и нижняя граница. Например, группы предприятий по численности работающих человек: 200-600,600-100 и т.д. Эта запись предполагает, что единица, у которой значение признака совпадает с верхней границей, относится к следующей группе и интервал читается как "от - до". Если указана только верхняя или только нижняя граница, то интервал называют открытым. Например, до 200 человек или 2000 человек и более. Ширина открытого интервала принимается равной ширине смежного с ним интервала.

Закрытые интервалы подразделяются на равные и неравные. Величину равного интервала мы с вами рассматривали, когда строили вариационные ряды. Формула равного интервала:

, где к – число групп

Полученную величину округляют. Она является шагом интервала.

 

Если полученное число имеет один знак до запятой, то полученные значения округляют до десятых. Если величина имеет два знака до запятой, то округляют до целого числа.

Неравные интервалы применяются в статистике, когда значение признака варьируется неравномерно и в значительных размерах. Неравные интервалы могут определяться как равнонаполненные. При этом совокупность разделяется на группы равного объема с числом единиц равным , где n - общее число единиц, а k - число групп.

Неравные интервалы могут быть прогрессивно возрастающие или убывающие в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся по арифметической прогрессии, определяется по формуле:

ik+1 = ik+ a;

 

в геометрической прогрессии:

ik+1 = ik∙ q, где

а - константа - число, которое будет положительным при прогрессивно возрастающих интервалах и отрицательным при прогрессивно убывающих интервалах;

q - константа - положительное число, которое при прогрессивно возрастающих интервалах будет больше 1, а при прогрессивно убывающих - меньше 1.

При определении границ интервалов статистических группировок исходят из того, что изменение количественного признака приводит к появлению нового качества. В этом случае граница устанавливается там, где происходит переход от одного качества к другому.

При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно возрастающими, ни прогрессивно убывающим. Такие интервалы называют произвольными. Например, при переписи населения 1989 года для группировки семей и одиночек по размеру жилой площади, приходящейся на одного человека, применялись следующие группы (м2): до5; 5-6; 7-8; 9-12; 13-14; 15-19; 20 и более. Произвольные интервалы часто используют при группировки рабочих по выработке продукции, предприятий по уровню рентабельности.

Группировка с произвольным интервалами может быть построена с помощью коэффициента вариации, определяемого по формуле ν = : σ.

Построение группировки этим методом начинается с упорядочения единиц совокупности по возрастанию или убыванию группировочного признака. В полученном ряду значений признака его значения объединяют в группу до тех пор, пока исчисленный для этой группы коэффициент вариации не станет, равен 33%. Это будет свидетельствовать об образовании первой группы, которая исключается из совокупности. Оставшаяся её часть принимается за новую совокупность, для которой повторяется алгоритм образования новой группы. Итак, до тех пор, пока все единицы совокупности не будут объединены в группы.

 

– Конец работы –

Эта тема принадлежит разделу:

СТАТИСТИКА. КУРС ЛЕКЦИЙ

РАЗДЕЛ I ОПИСАТЕЛЬНАЯ СТАТИСТИКА... Тема Статистика как наука Методы статистики...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Значение и сущность группировки. Построение группировки

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

СТАТИСТИКА. КУРС ЛЕКЦИЙ
          ВВЕДЕНИЕ

Общее понятие статистики. Предмет статистики.
Слово "статистика" происходит от латинского слова status - состояние, положение вещей. Первоначально оно употреблялось в значении "политическое состояние". Отсюда и итальянское

Статистическое исследование. Методы статистики
Статистика изучает совокупности однокачественных явлений в конкретных условиях места и времени. И, следовательно, статистика располагает всегда ограниченным числом данных. Каждое явление возникает

Статистическое наблюдение. Виды статистического наблюдения.
Статистическое наблюдение - это массовое, планомерное, научно организованное наблюдение за явлениями экономической и социальной жизни. Это наблюдение может проводиться органами государственной стат

Сущность и значение статистических показателей. Показатель и его атрибуты
Мы уже говорили, что статистика изучает массовые явления, процессы количественно в числовой форме. Но "числа", применяемые в статистике, это не абстрактные числа математики, которые харак

Общие принципы построения относительных статистических показателей
При построении относительных статистических показателей необходимо соблюдать следующие принципы. Принцип 1. Сравниваемые абсолютные показатели в относительных величинах должны быть

Понятие о системах статистических показателей
Как правило, изучаемые статистикой процессы и явления, достаточно сложны и поэтому их сущность не может быть выражены в отдельном показателе. В таких случаях используют систему статистических показ

Роль и значение статистических показателей в управлении экономическими и социальными процессами
Основной функцией конкретных статистических показателей и их систем является познавательная информационная функция. Без статистической информации невозможно познание закономерностей природны

Статистические таблицы
Статистические данные должны быть представлены так, чтобы ими можно было пользоваться. Существуют три способа представления данных: они могут быть включены в текст, представлены в таблицах или выра

Распределение занятого населения России по секторам экономики (млн. человек)
  Всего занято в экономике В том числе: 72,1 66,0 На государственных и му

Основные виды графиков
Иногда статистические таблицы дополняются графиками, когда ставится цель подчеркнуть какую-то особенность данных, провести их сравнение. Графики являются самой эффективной формой представления данн

Карты и картограммы.
Картограммы и картодиаграммы применяются для изображения графической характеристики изучаемых явлений. Они показывают размещение изучаемого явления, его интенсивность на определенной территории - в

Виды группировок
В зависимости от числа положенных в основание группировки признаков различают простые и многомерные группировки. Простой называется группировка, выполненная по одному признаку. Среди прост

В апреле 1994 г.
Группа населения по размеру среднедушевого денежного дохода, тыс. руб. в месяц Численность населения Всего млн. ч. % к итогу

По сумме активов баланса (данные условные)
Группа банков по сумме активов баланса, млн. руб. Количество банков, единиц В среднем на один банк Численность занятых, человек

И числу детей в 1989 г.
(по материалам переписи населения) Группа семей по месту проживания В том числе подгруппа семей по числу детей Число семей, тыс.

Многомерные группировки
Группировка, осуществляемая одновременно по комплексу признаков называется многомерной. Характеристика одной и той же стороны изучаемого явления может быть дана с помощью набора пр

Средняя арифметическая величина. Свойства средней арифметической величины
Как мы уже говорили раньше, статистика изучает массовые явления и процессы. Каждое такое явление обладает как общими для всей совокупности свойствами, так и особенными, индивидуальными свойствами.

Понятие средней арифметической
Виды средних величин отличают, прежде всего, тем, какое свойство, какой параметр исходной варьирующей массы индивидуальных значений признака должен быть сохранен неизменным. Средней ари

Виды средней арифметической
Если при группировке значения осредняемого признака заданы интервалами, то при расчете средней арифметической величины в качестве значения признака в группах принимаются середины этих интервалов, т

Свойства арифметической средней
1. Сумма отклонений индивидуальных значений признака от его среднего значения равна нулю. Доказательство:

Средняя квадратическая величина
Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить н

Средняя геометрическая величина
Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменным произведение индивидуальных величин, то применяют среднюю геометрическую величину. Её формула так

Средняя гармоническая величина
Если по условиям задачи необходимо, чтобы неизменной оставалась при осреднении сумма величин, обратных индивидуальным значениям признака, то средняя величина является гармонической средней. Иными с

Вариации массовых явлений. Построение вариационного ряда
Составной частью сводной обработки данных статистического наблюдения является построение рядов распределения. Как мы уже говорили ранее, в зависимости от того, является признак, взятый за основу гр

Структурные характеристики вариационного ряда. Показатели размера и интенсивности вариации.
При изучении вариации применяются такие характеристики вариационного ряда, которые описывают количественно его структуру, строение. К ним относят медиану и моду, которые еще часто называют структур

Показатели размера и интенсивности вариации.
Абсолютные средние размеры вариации. Следующим этапом изучения вариации признака в совокупности является измерение характеристик величины вариации. Простейшим из них служит

Относительное отклонение по модулю m
3) коэффициент вариации как относительное квадратическое от

Закономерности распределения.
В приведенном примере можно заметить определенную зависимость между изменением варьирующегося признака и частот. Частоты в этих рядах с увеличением значения признака первоначально увеличиваются, а

Тема 6. Выборочное наблюдение.
  1. Способы формирования выборочной совокупности. Виды выборки. 2. Ошибка выборки. 3. Определение необходимой численности выборки. 4. Малая выборка.

Ошибка выборки
Развитие современной теории выборочного наблюдения началось с простой случайной выборки. В процессе проведения выборочного наблюдения, как и вообще при анализе данных любого обследования в

Определение необходимой численности выборки.
Средняя квадратическая (стандартная) ошибка выборки зависит от объема выборки и степени вариации признака в генеральной совокупности. Уменьшение стандартной ошибки выборки, а следовательно увеличен

Малая выборка
Таблицы интеграла вероятностей используются для выборок большого объема из бесконечно большой генеральной совокупности. Но уже при n > 100 получается несоответствие между табличными данными и ве

Понятие о статистической и корреляционной связи
Невозможно управлять явлениями, предсказывать их развитие без изучения характера, силы и других особенностей связей. Поэтому методы измерения связей составляют важную часть статистического анализа.

Парная регрессия на основе метода наименьших квадратов и метода группировок.
Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Аналитически связь между ними описывается уравнениями: прямой :

Множественная (многофакторная) регрессия.
Изучение связи между тремя и более связанными между собой признаками носит название множественной регрессии. При исследовании зависимостей методами множественной регрессии задача формулируется так

Оценка тесноты связи.
Измерение тесноты и направления связи между признаками предлагает определение меры соответствия вариации результативного признака от одного (при изучении парных зависимостей) или нескольких (множес

Проверка значимости параметров регрессии.
Проверка статистической значимости всех параметров, полученных в процессе корреляционно-регрессионного анализа, основывается на предположении, что все эти параметры, а точнее, их значения являются

Методы выявления типа тенденции динамики
Ряд динамики может быть подвержен влиянию различных факторов. Под действием эволюционных факторов происходят изменения, которые определяют общие направления развития, называемые тенденцией или т

Методика измерения параметров тренда
После того как установлено наличие тенденции в ряду динамики производится её описание с помощью уравнений, отражающих те или иные качественные свойства развития. Эта процедура называется методом сг

Методика изучения и показатели колеблемости
Если при изучении и измерении тенденции динамики колебания уровней играют лишь роль помех, то в дальнейшем они сами становятся предметом статистического исследования. Типы колебаний весьма разнообр

Прогнозирование на основе тренда
Методика статистического прогноза по тренду и колеблемости основана на их экстраполяции, т.е. на предположении, что параметры тренда и колеблемости сохраняться до прогнозируемого периода. Такая экс

Агрегатные и средние индексы
Агрегатный индекс – сложный относительный показатель, который характеризует среднее изменение социально-экономического явления, состоящего из несоизмеримых элементов. Латинское слово «агрега

Средние индексы
Помимо агрегатных индексов в статистике применяется другая их форма – средневзвешенные индексы. К их исчислению прибегают тогда, когда имеющаяся в распоряжении информация не позволяет рассчитать об

Индексы структурных сдвигов
При изучении динамики качественных показателей приходится определять изменение средней величины индексируемого показателя, которое может быть вызвано действием двух факторов – изменением значения и

Индексы пространственно-территориального сопоставления
В статистической практике часто возникает потребность в сопоставлении уровней экономического явления в пространстве: по странам, экономическим районам, , областям, т.е. в исчислении территориальных

Экономические индексы Ласпейреса, Пааше, Фишера. Индексы-дефляторы.
В рыночном хозяйстве особое место среди индексов качественных показателей отводится индексам цен. Основным назначением индекса цен является оценка динамики цен на товары производственного и непроиз

Границы и условия применения индексного метода
Индексный метод предполагает, что связь между признаками является жестко детерминированной, которая проявляется как в каждом отдельном случае (для отдельного товара, вида продукции, предприятия), т

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги