АНАЛИЗ НОМИНАТИВНЫХ ДАННЫХ - раздел Социология, ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА Методы, О Которых Пойдет Речь В Этой Главе, Касаются Проверки, По-Видимому, ...
Методы, о которых пойдет речь в этой главе, касаются проверки, по-видимому, самого широкого класса гипотез — в отношении тех явлений, измерения которых доступны в номинативной шкале.
Кто чаще обращается в службу знакомств: мужчины или женщины? Зависит ли количество аварий на производстве от дня недели? Можно ли утверждать, что водители-женщины чаще становятся участниками ДТП (дорожно-транспортных происшествий)?
Можно ли утверждать, что выигрыши в игре распределены не случайно среди проигрышей?
Данные для ответов на подобные обыденные и чисто академические вопросы могут быть получены при помощи простого способа — классификации событий и людей по интересующим градациям. И несмотря на, казалось бы, бесчисленное многообразие подобных ситуаций, все они могут быть сведены /с трем типичным случаям:
1. Кто чаще обращается в службу знакомств: мужчины или женщины? Для ответа на этот вопрос необходимо: а) подсчитать количество женщин и мужчин, обра тившихся в службу знакомств; б) воспользовавшись методом статистической проверки, сопоставить полученное эмпирическое соотношение мужчин и жен щин с ожидаемым (теоретическим) равномерным распределением.
2. Зависит ли количество аварий на производстве от дня недели? Проверка этого предположения требует выполнения сходных действий: а) подсчитать количе ство аварий для каждогодня недели за достаточно длительный промежуток вре-
ЧАСТЬ II, МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ
мени; б) воспользовавшись методом статистической проверки, сопоставить полученное эмпирическое распределение количества аварий по дням недели с ожидаемым (теоретическим) равномерным распределением.
Случай П.
1. Зависит ли предпочтение напитка (минеральная вода, сок, лимонад) от сезона (зима, весна, лето, осень)? Для проверки этого предположения необходимо для каждого респондента определить тип предпочитае мого напитка (первая номинативная переменная, 3
градации) и сезон опроса (вторая номинативная переменная — 4 градации).
2. Зависит ли предпочтение одного из пяти кандида тов на выборах от пола потенциального избирате ля? Для проверки этого предположения необходи мо для каждого респондента определить пол (первая номинативная переменная, 2 градации) и предпо читаемого кандидата, одного из пяти (вторая номи нативная переменная, 5 градаций).
3. Повлияла ли рекламная кампания на выбор респондентами одного из двух товаров? Это предположение требует опроса респондентов на предмет предпоч тения одного из двух товаров дважды: до рекламной кампании (первая номина тивная переменная, две градации) и после нее (вторая номинативная перемен ная, те же две градации).
Для решения подобных задач, связанных с анализом классификаций или таблиц сопряженности, оказывается достаточным применение одного и того же критерия — у}-Пирсона:
(9.1)
где Р— количество ячеек таблицы распределения или сопряженности, содержащих эмпирические значения частот;/,,/. — эмпирическое и теоретическое значения частот для одной ячейки; к— число градаций сопоставляемых распределений; / — количество сопоставляемых распределений. Приведенная формула является общей для различных ситуаций, и в каждом случае ее применение обладает своей спецификой.
!. Является ли закономерным последовательный повтор выигрышей среди проигрышей в игре или это случайные совпадения?
2. В последовательности событий X и Y является ли закономерным их чередова ние (X после Y и наоборот)?
3. Наблюдается ли закономерность в чередовании быстрых и медленных реакций на некоторый стимул: имеютли они тенденцию к группированию или после мед ленной реакции следует быстрая (и наоборот)?
Для решения задач такого типа необходимо упорядочить события во времени и подсчитать число серий. Серия — это последовательность однотип-
ГЛАВА 9. АНАЛИЗ НОМИНАТИВНЫХ ДАННЫХ
иых событий, непосредственно перед и после которой произошли события другого типа. Далее применяется критерий серий, позволяющий определить вероятность случайного появления наблюдаемого числа серий при условии хаотичного распределения событий А"среди событий Y.
Очень часто при исследовании классификаций, сопряженности или последовательности нет необходимости в накоплении данных в привычных таблицах типа «объект-признак»: результаты наблюдений сразу заносят в таблицу распределения (сопряженности) или составляют последовательность. В этом случае нет необходимости в использовании специальных статистических программ, и все расчеты можно провести «вручную». Тем более что они не составляют особого труда.
ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА ГИПОТЕЗЫ НАУЧНЫЕ И СТАТИСТИЧЕСКИЕ ПРИМЕР Исходя из... ПРИМЕР... Первым примером применения такой логики для проверки статистической ги потезы по видимому является работа врача...
Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:
АНАЛИЗ НОМИНАТИВНЫХ ДАННЫХ
Что будем делать с полученным материалом:
Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:
ГИПОТЕЗЫ НАУЧНЫЕ И СТАТИСТИЧЕСКИЕ
Обычно исследование проводится для проверки гипотезы, которая является следствием теоретических представлений.1 Эта гипотеза содержит утверждение о связи абстрактных категорий, относящ
ИДЕЯ ПРОВЕРКИ СТАТИСТИЧЕСКОЙ ГИПОТЕЗЫ
Рассмотрим идею проверки статистической гипотезы на примере. Предположим, психолог решил проверить пригодность разработанных ранее норм для имеющегося в его распоряжении теста интеллекта. Прежний
УРОВЕНЬ СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ
Статистическая значимость(Significant level, сокращенно Sig.), или р-уро-вень значимости(р-level), — основной результат проверки статис
СТАТИСТИЧЕСКОЕ РЕШЕНИЕ И ВЕРОЯТНОСТЬ ОШИБКИ
До сих пор под проверкой статистической гипотезы мы подразумевали процедуру определения надежности связи (р-уровня, как показателя статистической значимости). Однако в конечном итоге проверка ста
ВЫБОР МЕТОДА СТАТИСТИЧЕСКОГО ВЫВОДА
Приступая к операционализации содержательной гипотезы — к определению того, как будут измерены изучаемые явления, исследователь уже должен представлять себе, какому методу статистического выв
Анализ таблиц сопряженности
Условие применения: для. каждого объекта (испытуемого) выборки определена его принадлежность к одной из категорий (градаций) Хи к одной из категорий (градаций) Y (получена пе
Сравнение двух независимых выборок
Условия применения: признак измерен у объектов (испытуемых), каждый из которых принадлежит к одной из двух независимых выборок.
ПРИМЕР____________________________________
Сравнение 2-х зависимых выборок
Условия применения: (а) признак измерен у объектов (испытуемых), каждый из которых принадлежит к одной из двух зависимых выборок: либо при-
ГЛАВА 8. ВЫБОР МЕТОДА СТАТИСТИЧЕ
Сравнение более двух независимых выборок
Условия применения: признак измерен у объектов (испытуемых), каждый из которых принадлежит к одной из к независимых выборок (к > 2).
ЧАСТЬ II. МЕТОДЫ СТАТИС
Две градации
Эта задача сводится к сравнению численности двух долей объектов (людей, событий и т. д.) в совокупности: обладающих и не обладающих некоторым свойством.
ПРИМЕР________________________
Обработка на компьютере: биномиальный критерий
Исходные данные: значения бинарной номинативной переменной (0, 1) определены для каждого члена выборки и представлены одним столбцом.
Выбираем: Analyze (Метод) > Nonparam
Binomial Test
Category
N
Observed Prop.
Test Prop.
Exact Sig. (1-tailed)
Test Statistics
Y
Chi-Square{a) df Asymp. Sig.
13.333 4 .010
a 0 cells (.0%) have expected frequenc
Число градаций больше двух
По сравнению с анализом классификации, специфика применения критерия х2-Пирсона (формула 9.1) к таблицам сопряженности заключается в том, что теоретические частоты рассчитываются отдель
Независимые выборки
Это наиболее часто встречающаяся ситуация применения таблиц 2x2, когда одна группа объектов классифицируется по двум дихотомическим основаниям и проверяется гипотеза о связи этих двух оснований к
Повторные измерения
Структура исходных данных соответствует ситуации, когда одна выборка объектов классифицирована на две группы дважды по одному и тому же основанию. Рассмотрим проверку гипотезы в отношении таких да
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
Корреляционный анализ — это проверка гипотез о связях между переменными с использованием коэффициентов корреляции. Наиболее распространенные коэффициенты корреляции подробно рассмотрены в
ПАРАМЕТРИЧЕСКИЕ МЕТОДЫ СРАВНЕНИЯ ДВУХ ВЫБОРОК
Сравнение двух выборок по признаку, измеренному в метрической шкале, обычно предполагает сравнение средних значений с использованием параметрического критерия t-Стьюдента. Следует различать
КРИТЕРИЙ Г-СТЬЮДЕНТА ДЛЯ ЗАВИСИМЫХ ВЫБОРОК
Метод позволяет проверить гипотезу о том, что средние значения двух ie-неральных совокупностей, из которых извлечены сравниваемые зависимые выборки, отличаются друг от друга. Допущение зави
Критерий r-Стьюдента для одной выборки.
A) Выбираем Analyze > Compare meansj> One Sample T-Test...
Б) Воткрывшемся окне диалога выделяем и переносим интересующие переменные из левого окна
ОБЩИЕ ЗАМЕЧАНИЯ
К методам сравнения выборок, в соответствии с принятой классификацией1, мы относим способы проверки статистических гипотез о различии выборок по уровню выраженности признака, измеренно
СРАВНЕНИЕ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК
Самым популярным и наиболее чувствительным (мощным) аналогом критерия f-Стьюдента для независимых выборок является критерий U-Манна-Уитни (Mann-Whitney U). Непараметрическим его аналогом яв
Обработка на компьютере: критерий (7-Манна-Уитни
Для обработки использованы данные примера 12.1. В таблице исходных данных (Data Editor)для каждого из 16 объектов определены значения двух переменных: varl — значения количественно
СРАВНЕНИЕ ДВУХ ЗАВИСИМЫХ ВЫБОРОК
Самым чувствительным (мощным) аналогом критерия f-Стьюдента для зависимых выборок является критерий Т-Вилкоксона (Wilcoxon signed-rank test). Непараметрическим его аналогом является крите
Обработка на компьютере: критерий Г-Вилкоксона
Для обработки использованы данные примера 12.2. Исходные данные для обработки введены в таблицу (Data Editor)в виде двух переменных: varl — «Условие 1»; var2 — «Условие 2».
СРАВНЕНИЕ БОЛЕЕ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК
Критерий IIКраскала-Уоллеса (Kruskal- Wallis H) является непараметрическим аналогом однофакторного дисперсионного анализа (ANOVA) для независимых выборок, поэтому другое его название —
Обработка на компьютере: критерий Я-Краскала-Уоллеса
Для обработки использованы данные примера 12.3. В таблице исходных данных (Data Editor)для каждого из 16 объектов определены значения двух переменных: varl — значения количественно
СРАВНЕНИЕ БОЛЕЕ ДВУХ ЗАВИСИМЫХ ВЫБОРОК
Критерий %2-Фридмана (Friedman test) является непараметрическим аналогом однофакторного дисперсионного анализа (ANOVA) для повторных измерений. Он позволяет проверять гипотезы о
Обработка на компьютере: критерий х2-Фридмана
Для обработки использованы данные примера 12.4. Исходные данные для обработки введены в таблицу (Data Editor)в виде четырех переменных, соответствующих четырем сравниваемым услови
ОДНОФАКТОРНЫЙ ANOVA
Однофакторный (One-Way) ANOVA позволяет проверить гипотезу о том, что изучаемый фактор оказывает влияние на зависимую переменную (средние значения, соответствующие разным градациям фактора, различ
Условие 122
Так зависит ли запоминание материала от условий его предъявления?
Условие 1
Условие 2
Условие 3
№
Обработка на компьютере
Рассмотрим применение однофакторного ANOVA к данным примера 13.1 Исходные данные для анализа введены в таблицу (Data Editor)в следующем виде:
Descriptives VOSPR
Первая колонка — номера градаций фактора, вторая колонка (N) — численность выборок, Mean — средние значе
МНОЖЕСТВЕННЫЕ СРАВНЕНИЯ В ANOVA
В состав процедур ANOVA включаются множественные сравнения средних значений для разных уровней фактора: парные сравнения средних после отклонения H0(Post Hoc Tests); метод контрастов (C
Обработка на компьютере
Рассмотрим применение методов множественного сравнения с использованием данных примера 13.1. Применим метод Шеффе для парного сравнения средних и метод контрастов для сравнения третьего уровня фа
Новости и инфо для студентов