рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Методы и программные средства анализа данных

Методы и программные средства анализа данных - раздел Программирование,     Представлены Методические Аспекты Анализа Дан...

 

 

Представлены методические аспекты анализа данных, реализованного в статистическом пакете SPSS. Дается краткое изложение содержания методов и анализа получаемых статистических результатов с демонстрацией в командах и выдаче пакета. Возможности применения методов математической статистики проиллюстрированы на социологических данных.

Методическое пособие предназначено студентам, специалистам, желающим познакомиться с работой пакета и оценить возможности реализованных в нем методов.

 


Предисловие

Издание данного учебного пособия финансируется грантом в рамках проекта. В книгу включены материалы по проекту финансируемых грантом Российского фонда фундаментальных исследовании 00-06-80221.

Методы и программные средства анализа данных универсальны и могут быть использованы в различных областях науки - в социологии, экономике, медицине, биологии, криминалистике и др. Однако применение анализа данных в каждой области имеет свои особенности, связанные со структурой данных, содержанием задач и интерпретацией результатов. В данном методическом пособии мы ставили своей целью изложить анализ данных для социологов.

В основе изложения - пакет обработки и анализа социологических данных SPSS - Statistical Package for Social Science. Пакет содержит все основные разделы анализа данных, и во многих зарубежных и отечественных университетах является базовым для преподавания анализа данных студентам гуманитарного направления. У нас нет возможности изложить всю информацию о пакете, поэтому мы затрагиваем лишь ключевые моменты практического анализа данных с его использованием.

Учебные материалы, предоставляемые официальным дилером SPSS в России (http://www.spss.ru) включают три учебника - Руководство пользователя SPSS, Книга 1 [1] Руководство пользователя SPSS [2] и Руководство по применению SPSS [3] по многим разделам содержат достаточно полную методику применения пакета, поэтому мы во многих случаях за дополнительной информацией отправляем к этим руководствам. Однако они ориентированы преимущественно на работу с пакетом в режиме диалога. В нашем учебном пособии баланс от диалогового режима смещен на использование языка программирования заданий для SPSS, поскольку серьезная работа с данными требует определенных навыков и в этой области. При подготовке материалов в этом направлении использовался путеводитель по синтаксису SPSS [4]. Кроме того, нами использовалась интенсивно документация SPSS по регрессионному анализу [5], точным статистическим тестам [6], документацию по кластерному анализу и многомерному шкалированию [7], другие материалы по SPSS.

Следует заметить, что практически ежегодно выпускается новая версия SPSS, постоянно изменяется дизайн, появляются новые программы и возможности работы с пакетом. В настоящий момент мы ориентируемся на 9 версию, но считаем главным донести до читателя основные принципы работы с SPSS, основные команды управления его работой, которые остаются практически неизменными уже в течение 20 лет. Конечно, пытаемся, также, не упустить и новые его возможности.

Большинство статистических пакетов снабжено такими же основными методами, имеют аналогичную структуру данных, поэтому освоение SPSS даст должный навык, полезный для компьютерного анализа данных вообще.

Кроме того, в работе использованы общеизвестные учебники по статистическому анализу данных, но, к сожалению не всегда доступные российскому читателю учебные пособия, как курс эконометрического анализа Грина [8], настольная книга по статистической методологии - фундаментальный труд американских авторов [9], объемный учебник по прикладному статистическому анализу С.А.Айвазяна и В.С.Мхиторяна [10], учебник Ю.Н.Толстовой [11], имеющий методологическое значение.

В книгу включен также включен материал, связанный с анализом взаимосвязи между неальтернативными вопросами [12]. Здесь мы попытались простым языком раскрыть сложную тему анализа множественных сравнений в анализе значимости связи по таблицам для неальтернативных вопросов.


 

Глава 1. Информация, обрабатываемая статистическим пакетом

Анкетные данные

В современных статистических пакетах такую информацию принято представлять в виде таблицы. Обычно обрабатывается один файл данных, визуально это… При кодировании информации удобно пользоваться определенными правилами…

Пример 1.1.

Анкета обследования жалоб и проблем населения (шутка)

1. Пол

1. мужской

2. Женский

2. Возраст …………

3. Проблемы (укажите 3 основные проблемы):

1. Учеба

2. Свободное время

3. Любовь

4. Музыка

4. Жалобы:

1. Служба

2. Здоровье

3. Зарплата

4. Жена

5. Собака соседа

Матрица данных, собранных на основании такой анкеты, изображена на рис.1.1. Пол здесь закодирован в соответствии с содержимым анкеты кодами 1 - мужчины, 2 - женщины; возраст непосредственно введен в данные; проблемы закодированы в трех переменных - указаны коды обведенных при опросе подсказок; для каждой жалобы отведена своя переменная.

 

N Анкеты 1. Пол 2. Возраст 3. Проблемы: 4. Жалобы:
1. Служба 2. Здоровье 3. Зарплата 4. Жена 5. Собака соседа
.
.
. . . . . . . . . . .

Рис.1.1. Структура матрицы - данных обследования жалоб и проблем населения

 

На протяжении всего текста мы будем иллюстрировать работу пакета на более серьезном примере анкеты "Курильские острова", текст которой приведен в приложении 1, кроме того, иногда мы будем привлекать для анализа данные Российского мониторинга экономического положения и здоровья населения (RLMS, [13]).

Типы переменных

Типы переменных можно рассмотреть с технической точки зрения и в аспекте применения математических методов.

Типы кодирования переменных.

Строчные переменные используются достаточно редко, например, для введения ответов на открытые вопросы или фамилий респондентов, если имеется такая… Но обычно, при внесении в компьютер информации для статистической обработки,…

Тип шкалы измерения переменных.

Формируя данные, исследователь ставит в соответствие значениям переменной, имеющей содержательный смысл ("пол - мужской", "профессия - учитель"), числовые значения. Такое соответствие называется шкалой измерения переменной. В зависимости от свойств переменной выделяют шкалы: номинальную, ординальную (ранговую), интервальную и шкалу отношений.

Неколичественные шкалы

ОРДИНАЛЬНАЯ или РАНГАВАЯ. Часто значения признака выражают степень проявления какого-либо свойства и могут быть упорядочены. Например, работа…   Количественные шкалы:

Неальтернативные признаки

1. Для каждой подсказки заводится переменная, которая соответствует столбцу матрицы и кодируется с помощью 0 и 1. В частности, для ответов на… Согласны ли вы с тем, что А. Нужна новая конституция?

Имена переменных и метки, коды неопределенных значений

Каждый столбец данных должен быть поименован, при этом имеются короткие имена для удобства задания команд и длинные имена, удобные для выдачи результатов расчетов. В приведенной анкете можем обозначить признаки следующим образом:

V1, v2, v3s1, v3s2, v3s3, v4d1, v4d2, v4d3, v4d4, v4d5

Меткой переменной может быть и непосредственная формулировка вопроса и переработанный текст вопроса , например, "Назовите, пожалуйста, ваш… Метки значений - это текстовая расшифровка кодов значений переменных (для… Коды неопределенных значений. Нередко необходимо исключить из анализа коды переменных, соответствующих неопределенным…

– Конец работы –

Используемые теги: Методы, Программные, средства, анализа, данных0.082

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Методы и программные средства анализа данных

Что будем делать с полученным материалом:

Если этот материал оказался полезным для Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Еще рефераты, курсовые, дипломные работы на эту тему:

Методы системного анализа. Метод анализа иерархий
украЇнсЬка Інженерно педагогІчНА академІя... Тарасенко О П...

Функциональный Методы описательной Методы статистического анализа взаимосвязи признаков
На сайте allrefs.net читайте: Функциональный Методы описательной Методы статистического анализа взаимосвязи признаков...

Методы решения жестких краевых задач, включая новые методы и программы на С++ для реализации приведенных методов
Стр. 8. Второй алгоритм для начала счета методом прогонки С.К.Годунова.Стр. 9. Замена метода численного интегрирования Рунге-Кутта в методе прогонки… Стр. 10. Метод половины констант. Стр. 11. Применяемые формулы… Стр. 62. 18. Вычисление вектора частного решения неоднородной системы дифференциальных уравнений. Стр. 19. Авторство.…

МЕТОДЫ АНАЛИЗА ДАННЫХ
для выполнения исследований на младших курсах ФИСТ... С А Пиявский Несколько основных понятий математической статистики Сразу оговоримся что...

Сравнительный анализ МСФО 16 "Основные средства", МСФО 17 "Аренда" с ПБУ 6/01 "Учет основных средств"
Данная проблема актуальна и потому, что в период функционирования планово-регулируемой экономики, подлинное содержание элементов финансовой… Помимо, осмысления и внедрения в российскую практику провозглашенных в МСФО… Целью данной работы является провести сравнительный анализ сущности и взаимосвязи МСФО 16 «Основные средства», МСФО 17…

НАДЕЖНОЕ ПРОГРАММНОЕ СРЕДСТВО КАК ПРОДУКТ ТЕХНОЛОГИИ ПРОГРАММИРОВАНИЯ. ИСТОРИЧЕСКИЙ И СОЦИАЛЬНЫЙ КОНТЕКСТ ПРОГРАММИРОВАНИЯ. ИСТОЧНИКИ ОШИБОК В ПРОГРАММНОМ СРЕДСТВЕ
ВВЕДЕНИЕ... Лекция НАДЕЖНОЕ ПРОГРАММНОЕ СРЕДСТВО КАК ПРОДУКТ ТЕХНОЛОГИИ... Программа как формализованное описание процесса обработки данных Программное средство...

Статистический анализ ЭКСПЕРИМЕНТАЛЬНЫХ данных МЕТОДОМ наименьших квадратов
На сайте allrefs.net читайте: "Статистический анализ ЭКСПЕРИМЕНТАЛЬНЫХ данных МЕТОДОМ наименьших квадратов"

Программное обеспечение можно разделить на две группы: системное программное обеспечение СПО и прикладное программное обеспечение ППО
Программное обеспечение это общий термин для обозначения quot неосязаемых quot в отличие от физических составных частей компьютерной системы... Программное обеспечение можно разделить на две группы системное программное... СПО управляет ресурсами компьютерной системы и позволяет пользователям программировать в более выразительных языках...

Общее понятие о базах данных. Основные понятия систем управления базами данных. Модели данных. 10
Сетевые технологии обработки данных Компоненты вычислительных сетей... Принципы организации и основные топологии вычислительных сетей Принципы... Сетевой сервис и сетевые стандарты Средства использования сетевых сервисов...

Электрографический метод - метод регистрации и анализа биоэлектрических процессов человека и животных
Так, ни одно кардиологическое исследование не проводится теперь без тщательного анализа электрической активности сердца больного. Ценные… Современные электрографические установки, обеспечивающие многоканальную… В самом деле, если бы электрофизиолог и врач, пользующиеся электрографическим методом, попытались глубоко изучить…

0.041
Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • По категориям
  • По работам