Число градаций больше двух

По сравнению с анализом классификации, специфика применения крите­рия х2-Пирсона (формула 9.1) к таблицам сопряженности заключается в том, что теоретические частоты рассчитываются отдельно для каждой ячейки таб­лицы. Таким образом, число слагаемых в формуле 9.1 равно количеству ячеек таблицы сопряженности и равно Р = к-1, где к—число строк, /— число столбцов:



(9.2)


Формула для расчета теоретической частоты для ячейки /-строки иу'-столбца:



(9.3)


сумма частот во всех ячейках /-строки;^ — сумма частот во всех ячей­ках у-столбца; N— сумма частот всей таблицы сопряженности.

ПРИМЕР 9,4___________________________________________________________

Для каждого респондента репрезентативной выборки определены: а) пол; б) один из пяти предпочитаемых политических лидеров:

 

 

Эмпирические К(политический лидер)  
частоты Всего:
*(пол) муж.(1)
жен. (2)
Всего:

Проверяется содержательная гипотеза о зависимости политических предпочтений от пола.

Но: классификации объектов по двум основаниям являются независимыми (рас­пределение объектов по полу не зависит от их распределения по предпочтениям политических лидеров). Проверяем Но на уровне а = 0,05.

Шаг 1. Составляем таблицу сопряженности для теоретических (ожидаемых) час­тот — с теми же полями, что и для таблицы эмпирических (наблюдаемых) частот. Рассчитываем значения теоретических частот для каждой ячейки этой таблицы по формуле 9.3.

г 5Ы6 ___
для ячейки Cxb.yi) Л " '

.fl<.

для ячейки (хх, у2) Л =


для ячейки


i, >>з) Л = 1Qg = 14,09;



ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ

 

 

Теоретические ^(политический лидер)  
частоты Всего:
ЛГ (пол) муж.(1) 7,77 17,97 14,09 6,31 4,86
жен. (2) 8,23 19,03 14,91 6,69 5,14
Всего:

Ш а г 3. Определяем р-уровень по таблице критических значений у^-Пирсона и прини­маем статистическое решение. Для df= 4 наше эмпирическое значение располага­ется между критическими для р — 0,05 и/? = 0,01. Следовательно, ^-уровень в нашем случае р < 0,05. Мы можем отклонить Но.

Ш а г 4. Формулируем содержательный вывод. Обнаружена статистически значимая зависимость политических предпочтений от пола < 0,05).

Порядок расчетов остается тем же для любого числа градаций того и друго­го признака, за исключением случая таблиц сопряженности 2x2. Для упро-


ГЛАВА 9. АНАЛИЗ НОМИНАТИВНЫХ ДАННЫХ

тения арифметических расчетов может быть использована формула, эквива­лентная формуле 9.2:



 


где N— общая численность выборки; к, I — число строк и столбцов таблицы сопряженности.

Обратим внимание, что при отклонении Н(} принимается альтернативная гипотеза о связи двух оснований классификации, которая проявляется по крайней мере для одной ячейки таблицы сопряженности. Но остается неиз­вестным то, в отношении каких именно ячеек таблицы сопряженности связь проявляется, а в отношении каких — не проявляется. Иными словами, воз­никает проблема множественных сравнений. И для дальнейшей конкретиза­ции результатов необходим анализ соотношения 2-х долей или таблиц со­пряженности 2x2.

Исследование связи пола и предпочтений политических лидеров (см. пример 9.4) может быть продолжено. Так, может быть дополнительно проверена гипотеза о том, что лидер № 2 предпочитается чаще мужчинами, чем женщинами. Тогда необходи­мо сравнивать эмпирическое рас­пределение предпочтений мужчин и женщин (25:12) с равномерным распределением (13,5:13,5) — при помощи метода сопоставления эмпирического и теоретического распределений. Может быть также проверена гипотеза о том, что ли­дер № 2 чаще предпочитается муж­чинами, а лидер № 3 — женщина­ми. Тогда необходимо сопоставить два эмпирических распределения: 25:12 и 10:19 — при помощи ана-

лиза таблиц сопряженности 2x2.

Таблицы сопряженности 2x2

Существует большое разнообразие различных ситуаций, когда по резуль­татам исследования может быть построена таблица сопряженности 2x2. Их объединяет то, что объекты (испытуемые, события) классифицированы по двум основаниям, каждое из которых представляет собой дихотомию. Важно различать два варианта такой классификации объектов:

1) по двум различным дихотомическим основаниям — случай независимых
выборок;

2) по одному и тому же дихотомическому основанию дважды (например, до
и после воздействия) — случай зависимых выборок.


ЧАСТЬ П. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ

ПРИМЕРЫ

1. Случай независимых выборок. Две группы больных известной численности по­
лучали курс лечения разными методами. Подсчитывалось число рецидивов за­
болевания в той и другой группе. Одна переменная — «методлечения» (1-й, 2-й),
другая — «рецидив» (есть, нет).

2. Случай зависимых выборок. Подсчитывалось число тех, кто «за», и тех, кто «про­
тив» смертной казни: до и после убедительной лекции о введении моратория на
смертную казнь. Одна переменная — «до лекции» («за», «против»), другая пере­
менная — «после лекции» («за», «против»).

Для независимых выборок применяется критерий х2-Пирсона, а для зави­симых более адекватным является метод Мак-Нимара.