рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Многомерные группировки

Многомерные группировки - раздел Математика, СТАТИСТИКА. КУРС ЛЕКЦИЙ Группировка, Осуществляемая Одновременно По Комплексу Признаков Называется ...

Группировка, осуществляемая одновременно по комплексу признаков называется многомерной. Характеристика одной и той же стороны изучаемого явления может быть дана с помощью набора признаков. Например, для характеристики технического уровня развития предприятий может быть использованы следующие показатели: удельный вес активной части промышленно-производственных основных фондов, удельный вес автоматических машин и оборудования в составе рабочих машин и оборудования, электровооруженность труда, машиновооруженность рабочих, коэффициент обновления машин и оборудования.

Характеризуя таким образом каждую единицу совокупности набором признаков, можно рассматривать эту единицу как точку в m-мерном пространстве, а задача многомерной группировки будет состоять в выделении точек, составляющих однородные группы единиц. Исходные данные для задачи многомерной группировки представляют в виде матрицы «объект-признак». Строками ее являются значения признаков, характеризующих соответствующий объект, а столбцами – значения каждого признака для рассматриваемой совокупности объектов.

Мерой «сходства» между единицами может служить различные критерии. В зависимости от выбранного критерия и существуют различные виды многомерной группировки.

Выделяют 3 типа мер сходства:

1. коэффициент подобия;

2. коэффициент связи;

3. показатели расстояния.

Меры первого и второго типов называют мерами близости: чем больше их величины, тем ближе объекты к друг другу.

Обратное положение с показателями расстояния: чем больше их величины, тем больше различия между объектами.

Меры сходства могут определяться как между объектами, так и между признаками.

Для измерения степени близости между парами объектов (i и j) используют коэффициенты подобия S. Один из наиболее простых способов рассчитать этот коэффициент по формуле:

, где Рij – число совпадающих признаков у объектов i и j, а m – общее число признаков, по которым осуществляется сравнение. Очевидно, что 01.

Часто в качестве мер сходства используют коэффициент корреляции – либо как измеритель силы связи между объектами (строками матрицы), либо как измерители связи признаков (столбцами матрицами).

Если признаки не поддаются точной количественной оценке, то мерами их связи служат коэффициенты ранговой корреляции.

Во многих случаях роль меры сходства играет функция расстояния. Для сопоставимости статистических показателей расстояния определяют по статистическим стандартизированным данным, т.е. заменяют первичные данные данными, вычисляемыми по формуле:

Чаще всего принимаются следующие меры расстояния между объектами:

1. хеммингово расстояние:

2. евклидово расстояние:

где xil – значение l-го признака у объекта i

xjl – значение l-го признака у объекта j

Евклидово расстояние не учитывает неравнозначность осей пространства. При ненормированных осях возможен случай, когда 2 объекта, сильно различающихся только по одному признаку, окажутся далекими в евклидовом пространстве. Поэтому часто вводят взвешенное евклидово расстояние, где подбором весов wl пытаются нормировать оси пространства:

, где

Обычно величину wl - обратно пропорциональна среднему квадратическому отклонению σ значений признака хl.

3. расстояние Махаланобиса:

где Xi=( Xi1, … , Xim) – строки значений признаков для объекта i

Xj=( Xj1, … , Xjm) – строки значений признаков для объекта j

R-1 – матрица, обратная матрице парных линейных коэффициентов корреляции признаков.

Применение методов многомерной группировки связано с большой вычислительной работой и осуществляется с помощью специальных алгоритмов, реализованных в различных статистических пакетах прикладных программ.

С помощью различных методов (дендроидов, метода шаров, корреляционных плеяд, многомерной средней, кластерного анализа) осуществляется формирование групп, в которых единицы совокупности объединяются на основании близости по всему комплексу признаков.

 

– Конец работы –

Эта тема принадлежит разделу:

СТАТИСТИКА. КУРС ЛЕКЦИЙ

РАЗДЕЛ I ОПИСАТЕЛЬНАЯ СТАТИСТИКА... Тема Статистика как наука Методы статистики...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Многомерные группировки

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

СТАТИСТИКА. КУРС ЛЕКЦИЙ
         

Общее понятие статистики. Предмет статистики.
Слово "статистика" происходит от латинского слова status - состояние, положение вещей. Первоначально оно употреблялось в значении "политическое состояние". Отсюда и итальянское

Статистическое исследование. Методы статистики
Статистика изучает совокупности однокачественных явлений в конкретных условиях места и времени. И, следовательно, статистика располагает всегда ограниченным числом данных. Каждое явление возникает

Статистическое наблюдение. Виды статистического наблюдения.
Статистическое наблюдение - это массовое, планомерное, научно организованное наблюдение за явлениями экономической и социальной жизни. Это наблюдение может проводиться органами государственной стат

Сущность и значение статистических показателей. Показатель и его атрибуты
Мы уже говорили, что статистика изучает массовые явления, процессы количественно в числовой форме. Но "числа", применяемые в статистике, это не абстрактные числа математики, которые харак

Общие принципы построения относительных статистических показателей
При построении относительных статистических показателей необходимо соблюдать следующие принципы. Принцип 1. Сравниваемые абсолютные показатели в относительных величинах должны быть

Понятие о системах статистических показателей
Как правило, изучаемые статистикой процессы и явления, достаточно сложны и поэтому их сущность не может быть выражены в отдельном показателе. В таких случаях используют систему статистических показ

Роль и значение статистических показателей в управлении экономическими и социальными процессами
Основной функцией конкретных статистических показателей и их систем является познавательная информационная функция. Без статистической информации невозможно познание закономерностей природны

Статистические таблицы
Статистические данные должны быть представлены так, чтобы ими можно было пользоваться. Существуют три способа представления данных: они могут быть включены в текст, представлены в таблицах или выра

Распределение занятого населения России по секторам экономики (млн. человек)
  Всего занято в экономике В том числе: 72,1 66,0 На государст

Основные виды графиков
Иногда статистические таблицы дополняются графиками, когда ставится цель подчеркнуть какую-то особенность данных, провести их сравнение. Графики являются самой эффективной формой представления данн

Карты и картограммы.
Картограммы и картодиаграммы применяются для изображения графической характеристики изучаемых явлений. Они показывают размещение изучаемого явления, его интенсивность на определенной территории - в

Значение и сущность группировки. Построение группировки
Изучаемые статистикой массовые явления и процессы протекают в множествах элементов (единиц) некоторого вида, или совокупностях. Определить совокупность – значит определить входящие в нее элементы,

Виды группировок
В зависимости от числа положенных в основание группировки признаков различают простые и многомерные группировки. Простой называется группировка, выполненная по одному признаку. Среди прост

В апреле 1994 г.
Группа населения по размеру среднедушевого денежного дохода, тыс. руб. в месяц Численность населения Всего млн. ч. % к ит

По сумме активов баланса (данные условные)
Группа банков по сумме активов баланса, млн. руб. Количество банков, единиц В среднем на один банк Численность занятых, ч

И числу детей в 1989 г.
(по материалам переписи населения) Группа семей по месту проживания В том числе подгруппа семей по числу детей Число се

Средняя арифметическая величина. Свойства средней арифметической величины
Как мы уже говорили раньше, статистика изучает массовые явления и процессы. Каждое такое явление обладает как общими для всей совокупности свойствами, так и особенными, индивидуальными свойствами.

Понятие средней арифметической
Виды средних величин отличают, прежде всего, тем, какое свойство, какой параметр исходной варьирующей массы индивидуальных значений признака должен быть сохранен неизменным. Средней ари

Виды средней арифметической
Если при группировке значения осредняемого признака заданы интервалами, то при расчете средней арифметической величины в качестве значения признака в группах принимаются середины этих интервалов, т

Свойства арифметической средней
1. Сумма отклонений индивидуальных значений признака от его среднего значения равна нулю. Доказательство:

Средняя квадратическая величина
Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить н

Средняя геометрическая величина
Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменным произведение индивидуальных величин, то применяют среднюю геометрическую величину. Её формула так

Средняя гармоническая величина
Если по условиям задачи необходимо, чтобы неизменной оставалась при осреднении сумма величин, обратных индивидуальным значениям признака, то средняя величина является гармонической средней. Иными с

Вариации массовых явлений. Построение вариационного ряда
Составной частью сводной обработки данных статистического наблюдения является построение рядов распределения. Как мы уже говорили ранее, в зависимости от того, является признак, взятый за основу гр

Структурные характеристики вариационного ряда. Показатели размера и интенсивности вариации.
При изучении вариации применяются такие характеристики вариационного ряда, которые описывают количественно его структуру, строение. К ним относят медиану и моду, которые еще часто называют структур

Показатели размера и интенсивности вариации.
Абсолютные средние размеры вариации. Следующим этапом изучения вариации признака в совокупности является измерение характеристик величины вариации. Простейшим из них служит

Относительное отклонение по модулю m
3) коэффициент вариации как относительное квадратическое от

Закономерности распределения.
В приведенном примере можно заметить определенную зависимость между изменением варьирующегося признака и частот. Частоты в этих рядах с увеличением значения признака первоначально увеличиваются, а

Тема 6. Выборочное наблюдение.
  1. Способы формирования выборочной совокупности. Виды выборки. 2. Ошибка выборки. 3. Определение необходимой численности выборки. 4. Малая выборка.

Ошибка выборки
Развитие современной теории выборочного наблюдения началось с простой случайной выборки. В процессе проведения выборочного наблюдения, как и вообще при анализе данных любого обследования в

Определение необходимой численности выборки.
Средняя квадратическая (стандартная) ошибка выборки зависит от объема выборки и степени вариации признака в генеральной совокупности. Уменьшение стандартной ошибки выборки, а следовательно увеличен

Малая выборка
Таблицы интеграла вероятностей используются для выборок большого объема из бесконечно большой генеральной совокупности. Но уже при n > 100 получается несоответствие между табличными данными и ве

Понятие о статистической и корреляционной связи
Невозможно управлять явлениями, предсказывать их развитие без изучения характера, силы и других особенностей связей. Поэтому методы измерения связей составляют важную часть статистического анализа.

Парная регрессия на основе метода наименьших квадратов и метода группировок.
Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Аналитически связь между ними описывается уравнениями: прямой :

Множественная (многофакторная) регрессия.
Изучение связи между тремя и более связанными между собой признаками носит название множественной регрессии. При исследовании зависимостей методами множественной регрессии задача формулируется так

Оценка тесноты связи.
Измерение тесноты и направления связи между признаками предлагает определение меры соответствия вариации результативного признака от одного (при изучении парных зависимостей) или нескольких (множес

Проверка значимости параметров регрессии.
Проверка статистической значимости всех параметров, полученных в процессе корреляционно-регрессионного анализа, основывается на предположении, что все эти параметры, а точнее, их значения являются

Методы выявления типа тенденции динамики
Ряд динамики может быть подвержен влиянию различных факторов. Под действием эволюционных факторов происходят изменения, которые определяют общие направления развития, называемые тенденцией или т

Методика измерения параметров тренда
После того как установлено наличие тенденции в ряду динамики производится её описание с помощью уравнений, отражающих те или иные качественные свойства развития. Эта процедура называется методом сг

Методика изучения и показатели колеблемости
Если при изучении и измерении тенденции динамики колебания уровней играют лишь роль помех, то в дальнейшем они сами становятся предметом статистического исследования. Типы колебаний весьма разнообр

Прогнозирование на основе тренда
Методика статистического прогноза по тренду и колеблемости основана на их экстраполяции, т.е. на предположении, что параметры тренда и колеблемости сохраняться до прогнозируемого периода. Такая экс

Агрегатные и средние индексы
Агрегатный индекс – сложный относительный показатель, который характеризует среднее изменение социально-экономического явления, состоящего из несоизмеримых элементов. Латинское слово «агрега

Средние индексы
Помимо агрегатных индексов в статистике применяется другая их форма – средневзвешенные индексы. К их исчислению прибегают тогда, когда имеющаяся в распоряжении информация не позволяет рассчитать об

Индексы структурных сдвигов
При изучении динамики качественных показателей приходится определять изменение средней величины индексируемого показателя, которое может быть вызвано действием двух факторов – изменением значения и

Индексы пространственно-территориального сопоставления
В статистической практике часто возникает потребность в сопоставлении уровней экономического явления в пространстве: по странам, экономическим районам, , областям, т.е. в исчислении территориальных

Экономические индексы Ласпейреса, Пааше, Фишера. Индексы-дефляторы.
В рыночном хозяйстве особое место среди индексов качественных показателей отводится индексам цен. Основным назначением индекса цен является оценка динамики цен на товары производственного и непроиз

Границы и условия применения индексного метода
Индексный метод предполагает, что связь между признаками является жестко детерминированной, которая проявляется как в каждом отдельном случае (для отдельного товара, вида продукции, предприятия), т

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги