Реферат Курсовая Конспект
Методы и программные средства анализа данных - раздел Программирование, Представлены Методические Аспекты Анализа Дан...
|
Представлены методические аспекты анализа данных, реализованного в статистическом пакете SPSS. Дается краткое изложение содержания методов и анализа получаемых статистических результатов с демонстрацией в командах и выдаче пакета. Возможности применения методов математической статистики проиллюстрированы на социологических данных.
Методическое пособие предназначено студентам, специалистам, желающим познакомиться с работой пакета и оценить возможности реализованных в нем методов.
Предисловие
Издание данного учебного пособия финансируется грантом в рамках проекта. В книгу включены материалы по проекту финансируемых грантом Российского фонда фундаментальных исследовании 00-06-80221.
Методы и программные средства анализа данных универсальны и могут быть использованы в различных областях науки - в социологии, экономике, медицине, биологии, криминалистике и др. Однако применение анализа данных в каждой области имеет свои особенности, связанные со структурой данных, содержанием задач и интерпретацией результатов. В данном методическом пособии мы ставили своей целью изложить анализ данных для социологов.
В основе изложения - пакет обработки и анализа социологических данных SPSS - Statistical Package for Social Science. Пакет содержит все основные разделы анализа данных, и во многих зарубежных и отечественных университетах является базовым для преподавания анализа данных студентам гуманитарного направления. У нас нет возможности изложить всю информацию о пакете, поэтому мы затрагиваем лишь ключевые моменты практического анализа данных с его использованием.
Учебные материалы, предоставляемые официальным дилером SPSS в России (http://www.spss.ru) включают три учебника - Руководство пользователя SPSS, Книга 1 [1] Руководство пользователя SPSS [2] и Руководство по применению SPSS [3] по многим разделам содержат достаточно полную методику применения пакета, поэтому мы во многих случаях за дополнительной информацией отправляем к этим руководствам. Однако они ориентированы преимущественно на работу с пакетом в режиме диалога. В нашем учебном пособии баланс от диалогового режима смещен на использование языка программирования заданий для SPSS, поскольку серьезная работа с данными требует определенных навыков и в этой области. При подготовке материалов в этом направлении использовался путеводитель по синтаксису SPSS [4]. Кроме того, нами использовалась интенсивно документация SPSS по регрессионному анализу [5], точным статистическим тестам [6], документацию по кластерному анализу и многомерному шкалированию [7], другие материалы по SPSS.
Следует заметить, что практически ежегодно выпускается новая версия SPSS, постоянно изменяется дизайн, появляются новые программы и возможности работы с пакетом. В настоящий момент мы ориентируемся на 9 версию, но считаем главным донести до читателя основные принципы работы с SPSS, основные команды управления его работой, которые остаются практически неизменными уже в течение 20 лет. Конечно, пытаемся, также, не упустить и новые его возможности.
Большинство статистических пакетов снабжено такими же основными методами, имеют аналогичную структуру данных, поэтому освоение SPSS даст должный навык, полезный для компьютерного анализа данных вообще.
Кроме того, в работе использованы общеизвестные учебники по статистическому анализу данных, но, к сожалению не всегда доступные российскому читателю учебные пособия, как курс эконометрического анализа Грина [8], настольная книга по статистической методологии - фундаментальный труд американских авторов [9], объемный учебник по прикладному статистическому анализу С.А.Айвазяна и В.С.Мхиторяна [10], учебник Ю.Н.Толстовой [11], имеющий методологическое значение.
В книгу включен также включен материал, связанный с анализом взаимосвязи между неальтернативными вопросами [12]. Здесь мы попытались простым языком раскрыть сложную тему анализа множественных сравнений в анализе значимости связи по таблицам для неальтернативных вопросов.
Глава 1. Информация, обрабатываемая статистическим пакетом
Пример 1.1.
Анкета обследования жалоб и проблем населения (шутка)
1. Пол
1. мужской
2. Женский
2. Возраст …………
3. Проблемы (укажите 3 основные проблемы):
1. Учеба
2. Свободное время
3. Любовь
4. Музыка
4. Жалобы:
1. Служба
2. Здоровье
3. Зарплата
4. Жена
5. Собака соседа
Матрица данных, собранных на основании такой анкеты, изображена на рис.1.1. Пол здесь закодирован в соответствии с содержимым анкеты кодами 1 - мужчины, 2 - женщины; возраст непосредственно введен в данные; проблемы закодированы в трех переменных - указаны коды обведенных при опросе подсказок; для каждой жалобы отведена своя переменная.
N Анкеты | 1. Пол | 2. Возраст | 3. Проблемы: | 4. Жалобы: | ||||||
1. Служба | 2. Здоровье | 3. Зарплата | 4. Жена | 5. Собака соседа | ||||||
. | ||||||||||
. | ||||||||||
. | . | . | . | . | . | . | . | . | . | . |
Рис.1.1. Структура матрицы - данных обследования жалоб и проблем населения
На протяжении всего текста мы будем иллюстрировать работу пакета на более серьезном примере анкеты "Курильские острова", текст которой приведен в приложении 1, кроме того, иногда мы будем привлекать для анализа данные Российского мониторинга экономического положения и здоровья населения (RLMS, [13]).
Типы переменных
Типы переменных можно рассмотреть с технической точки зрения и в аспекте применения математических методов.
Тип шкалы измерения переменных.
Формируя данные, исследователь ставит в соответствие значениям переменной, имеющей содержательный смысл ("пол - мужской", "профессия - учитель"), числовые значения. Такое соответствие называется шкалой измерения переменной. В зависимости от свойств переменной выделяют шкалы: номинальную, ординальную (ранговую), интервальную и шкалу отношений.
Имена переменных и метки, коды неопределенных значений
Каждый столбец данных должен быть поименован, при этом имеются короткие имена для удобства задания команд и длинные имена, удобные для выдачи результатов расчетов. В приведенной анкете можем обозначить признаки следующим образом:
– Конец работы –
Используемые теги: Методы, Программные, средства, анализа, данных0.082
Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Методы и программные средства анализа данных
Если этот материал оказался полезным для Вас, Вы можете сохранить его на свою страничку в социальных сетях:
Твитнуть |
Новости и инфо для студентов