рефераты конспекты курсовые дипломные лекции шпоры

Раздел Социология
/
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ

Реферат Курсовая Конспект

Выберите учебное заведение

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ - раздел Социология, ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА Корреляционный Анализ — Это Проверка Гипотез О Связях Между Переменны...

Корреляционный анализ — это проверка гипотез о связях между переменными с использованием коэффициентов корреляции. Наиболее распространенные коэффициенты корреляции подробно рассмотрены в главе 6. В этой главе разбираются вопросы, непосредственно касающиеся проверки гипотез с применением коэффициентов корреляции.

Коэффициент корреляции — это мера прямой или обратной пропорциональности между двумя переменными. Он чувствителен к связи только в том случае, если эта связь является монотонной — не меняет направления по мере увеличения значений одной из переменных.

Основные показатели: сила, направление и надежность (достоверность) связи. Сила связи определяется по абсолютной величине корреляции (меняется от 0 до 1). Направление связи определяется по знаку корреляции: положительный — связь прямая; отрицательный — связь обратная. Надежность связи определяется /^-уровнем статистической значимости (чем меньше р-уро-вень, тем выше статистическая значимость, достоверность связи).

Условия применения коэффициентов корреляции:

□ переменные измерены в количественной (ранговой, метрической) шкале
на одной и той же выборке объектов;

□ связь между переменными является монотонной.

Основная проверяемая статистическая гипотеза в отношении коэффициентов корреляции является ненаправленной и содержит утверждение о равенстве корреляции нулю в генеральной совокупности Н_о: г_ху — 0. При ее отклонении принимается альтернативная гипотеза Hj: r_xy^0 о наличии положительной (отрицательной) корреляции — в зависимости от знака выборочного (вычисленного) коэффициента корреляции.

Содержательные выводы. Если по результатам статистической проверки Н_о: 7 = 0 не отклоняется на уровне а, то содержательный вывод: связь между х и у не обнаружена. Если Н_о: ?= О отклоняется на уровне а, то содержательный вывод: обнаружена положительная (отрицательная) связь между х и у.

Что влияет на р-уровень значимости корреляции ? Статистическая значимость коэффициента корреляции тем выше (р-уровень меньше), чем больше его аб-

ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ

солютная величина (при одном и том же объеме выборки) и чем больше объем выборки (при одном и том же значении корреляции). При большой численности выборки даже слабые связи могут достигать статистической значимости.

Например, для одного и того же значения г_ху = 0,200, если N < 90, то р > 0,05 — корреляция статистически не значима; а если N> 100, тор< 0,05 — связь статистически достоверна.

Величина корреляции не всегда отражает силу связи. Соответственно, /^-уровень значимости не всегда отражает надежность связи. Наиболее распространенные причины — «выбросы», «ложные» корреляции, нелинейные связи (см. раздел главы 6 «Величина корреляции и сила связи»).

КОРРЕЛЯЦИЯ МЕТРИЧЕСКИХ ПЕРЕМЕННЫХ

Статистическая гипотеза о связи двух метрических переменных проверяется в отношении коэффициента корреляции /--Пирсона, который вычисляется по формуле:

_xa_y

Основной (нулевой) статистической гипотезой является равенство г-Пир-сона нулю в генеральной совокупности (Н_о: r_vv = 0). Определение /?-уровня значимости осуществляется при помощи критерия ?-Стьюдента:

(10.1)

С целью упрощения проверки при обработке данных «вручную» обычно пользуются таблицами критических значений г_ху, которые составлены с помощью этого критерия (приложение 6). При вычислениях на компьютере статистическая программа (SPSS, Statistica) сопровождает вычисленный коэффициент корреляции более точным значением р-уровня.

Для статистического решения о принятии или отклонении Н_о обычно устанавливают а = 0,05, а для выборок большого объема (около 100 и более) а = 0,01. Если р < а, Н_о отклоняется и делается содержательный вывод о том, что обнаружена статистически достоверная (значимая) связь между изучаемыми переменными (положительная или отрицательная — в зависимости от знака корреляции). Когда р >а, Н_о не отклоняется, и содержательный вывод ограничен констатацией того, что связь (статистически достоверная) не обнаружена.

ГЛАВА 10. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ

Развернуть

Открыть в широком формате

– Конец работы –

Эта тема принадлежит разделу:

ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА

ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА ГИПОТЕЗЫ НАУЧНЫЕ И СТАТИСТИЧЕСКИЕ ПРИМЕР Исходя из... ПРИМЕР... Первым примером применения такой логики для проверки статистической ги потезы по видимому является работа врача...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: КОРРЕЛЯЦИОННЫЙ АНАЛИЗ

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

ГИПОТЕЗЫ НАУЧНЫЕ И СТАТИСТИЧЕСКИЕ
Обычно исследование проводится для проверки гипотезы, которая является следствием теоретических представлений.1 Эта гипотеза содержит утверждение о связи абстрактных категорий, относящ

ИДЕЯ ПРОВЕРКИ СТАТИСТИЧЕСКОЙ ГИПОТЕЗЫ
Рассмотрим идею проверки статистической гипотезы на примере. Предположим, психолог решил проверить пригодность разработанных ранее норм для имеющегося в его распоряжении теста интеллекта. Прежний

УРОВЕНЬ СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ
Статистическая значимость(Significant level, сокращенно Sig.), или р-уро-вень значимости(р-level), — основной результат проверки статис

СТАТИСТИЧЕСКОЕ РЕШЕНИЕ И ВЕРОЯТНОСТЬ ОШИБКИ
До сих пор под проверкой статистической гипотезы мы подразумевали процедуру определения надежности связи (р-уровня, как показателя статистической значимости). Однако в конечном итоге проверка ста

ВЫБОР МЕТОДА СТАТИСТИЧЕСКОГО ВЫВОДА
Приступая к операционализации содержательной гипотезы — к определению того, как будут измерены изучаемые явления, исследователь уже должен представлять себе, какому методу статистического выв

Анализ таблиц сопряженности
Условие применения: для. каждого объекта (испытуемого) выборки определена его принадлежность к одной из категорий (градаций) Хи к одной из категорий (градаций) Y (получена пе

Общий случай: число градаций больше двух
ПРИМЕР Исследовались различия между мужчинами и женщинами в предпочтениях пяти политических лидеров.

Таблицы сопряженности 2x2 с независимыми выборками
ПРИМЕР Методом «потерянных писем» исследовалась склонность людей передавать хорошие и плохие новости. Из

Таблицы сопряженности 2x2 с повторными измерениями
ПРИМЕР Необходимо сравнить два вопроса, заданных одной и той же группе испытуемых, по соотношению ответов

Сравнение двух независимых выборок
Условия применения: признак измерен у объектов (испытуемых), каждый из которых принадлежит к одной из двух независимых выборок. ПРИМЕР____________________________________

Сравнение 2-х зависимых выборок
Условия применения: (а) признак измерен у объектов (испытуемых), каждый из которых принадлежит к одной из двух зависимых выборок: либо при- ГЛАВА 8. ВЫБОР МЕТОДА СТАТИСТИЧЕ

Сравнение более двух независимых выборок
Условия применения: признак измерен у объектов (испытуемых), каждый из которых принадлежит к одной из к независимых выборок (к > 2). ЧАСТЬ II. МЕТОДЫ СТАТИС

АНАЛИЗ НОМИНАТИВНЫХ ДАННЫХ
Методы, о которых пойдет речь в этой главе, касаются проверки, по-видимому, самого широкого класса гипотез — в отношении тех явлений, измерения которых доступны в номинативной шкале.

Две градации
Эта задача сводится к сравнению численности двух долей объектов (людей, событий и т. д.) в совокупности: обладающих и не обладающих некоторым свойством. ПРИМЕР________________________

Обработка на компьютере: биномиальный критерий
Исходные данные: значения бинарной номинативной переменной (0, 1) определены для каждого члена выборки и представлены одним столбцом. Выбираем: Analyze (Метод) > Nonparam

Binomial Test
Category N Observed Prop. Test Prop. Exact Sig. (1-tailed)

Test Statistics
Y Chi-Square{a) df Asymp. Sig. 13.333 4 .010 a 0 cells (.0%) have expected frequenc

Число градаций больше двух
По сравнению с анализом классификации, специфика применения критерия х2-Пирсона (формула 9.1) к таблицам сопряженности заключается в том, что теоретические частоты рассчитываются отдель

Независимые выборки
Это наиболее часто встречающаяся ситуация применения таблиц 2x2, когда одна группа объектов классифицируется по двум дихотомическим основаниям и проверяется гипотеза о связи этих двух оснований к

Повторные измерения
Структура исходных данных соответствует ситуации, когда одна выборка объектов классифицирована на две группы дважды по одному и тому же основанию. Рассмотрим проверку гипотезы в отношении таких да

ПАРАМЕТРИЧЕСКИЕ МЕТОДЫ СРАВНЕНИЯ ДВУХ ВЫБОРОК
Сравнение двух выборок по признаку, измеренному в метрической шкале, обычно предполагает сравнение средних значений с использованием параметрического критерия t-Стьюдента. Следует различать

КРИТЕРИЙ Г-СТЬЮДЕНТА ДЛЯ ЗАВИСИМЫХ ВЫБОРОК
Метод позволяет проверить гипотезу о том, что средние значения двух ie-неральных совокупностей, из которых извлечены сравниваемые зависимые выборки, отличаются друг от друга. Допущение зави

Критерий r-Стьюдента для одной выборки.
A) Выбираем Analyze > Compare meansj> One Sample T-Test... Б) Воткрывшемся окне диалога выделяем и переносим интересующие переменные из левого окна

Group Statistics

Paired Samples Statistics
Mean N Std. Deviation Std. Error Mean Pair 1 VAR2 VAR3 11.9000 9.6000

Paired Samples Test
Paired Differences

ОБЩИЕ ЗАМЕЧАНИЯ
К методам сравнения выборок, в соответствии с принятой классификацией1, мы относим способы проверки статистических гипотез о различии выборок по уровню выраженности признака, измеренно

СРАВНЕНИЕ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК
Самым популярным и наиболее чувствительным (мощным) аналогом критерия f-Стьюдента для независимых выборок является критерий U-Манна-Уитни (Mann-Whitney U). Непараметрическим его аналогом яв

Обработка на компьютере: критерий (7-Манна-Уитни
Для обработки использованы данные примера 12.1. В таблице исходных данных (Data Editor)для каждого из 16 объектов определены значения двух переменных: varl — значения количественно

СРАВНЕНИЕ ДВУХ ЗАВИСИМЫХ ВЫБОРОК
Самым чувствительным (мощным) аналогом критерия f-Стьюдента для зависимых выборок является критерий Т-Вилкоксона (Wilcoxon signed-rank test). Непараметрическим его аналогом является крите

Обработка на компьютере: критерий Г-Вилкоксона
Для обработки использованы данные примера 12.2. Исходные данные для обработки введены в таблицу (Data Editor)в виде двух переменных: varl — «Условие 1»; var2 — «Условие 2».

СРАВНЕНИЕ БОЛЕЕ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК
Критерий IIКраскала-Уоллеса (Kruskal- Wallis H) является непараметрическим аналогом однофакторного дисперсионного анализа (ANOVA) для независимых выборок, поэтому другое его название —

Обработка на компьютере: критерий Я-Краскала-Уоллеса
Для обработки использованы данные примера 12.3. В таблице исходных данных (Data Editor)для каждого из 16 объектов определены значения двух переменных: varl — значения количественно

СРАВНЕНИЕ БОЛЕЕ ДВУХ ЗАВИСИМЫХ ВЫБОРОК
Критерий %2-Фридмана (Friedman test) является непараметрическим аналогом однофакторного дисперсионного анализа (ANOVA) для повторных измерений. Он позволяет проверять гипотезы о

Обработка на компьютере: критерий х2-Фридмана
Для обработки использованы данные примера 12.4. Исходные данные для обработки введены в таблицу (Data Editor)в виде четырех переменных, соответствующих четырем сравниваемым услови

ОДНОФАКТОРНЫЙ ANOVA
Однофакторный (One-Way) ANOVA позволяет проверить гипотезу о том, что изучаемый фактор оказывает влияние на зависимую переменную (средние значения, соответствующие разным градациям фактора, различ

Условие 122
Так зависит ли запоминание материала от условий его предъявления? Условие 1 Условие 2 Условие 3 №

Обработка на компьютере
Рассмотрим применение однофакторного ANOVA к данным примера 13.1 Исходные данные для анализа введены в таблицу (Data Editor)в следующем виде:

Descriptives VOSPR
Первая колонка — номера градаций фактора, вторая колонка (N) — численность выборок, Mean — средние значе

МНОЖЕСТВЕННЫЕ СРАВНЕНИЯ В ANOVA
В состав процедур ANOVA включаются множественные сравнения средних значений для разных уровней фактора: парные сравнения средних после отклонения H0(Post Hoc Tests); метод контрастов (C

Обработка на компьютере
Рассмотрим применение методов множественного сравнения с использованием данных примера 13.1. Применим метод Шеффе для парного сравнения средних и метод контрастов для сравнения третьего уровня фа

Scheffe
Fl N Subset for alpha = .05 1.00

N[(Mm-M)2 +(MB2-M)2+(MB3-M)2].