Таблиця 2х2

Задоволеність навчанням Показники успішності навчання Всього
високі низькі
Висока 20 (а) 0 (b)
Низька 30 (с) 50 (d)
Всього

 

Вже з попередніх даних, які наводяться в таблиці (частоти сумісної появи ознак), можна бачити, що існує залежність між ознаками “задоволеність навчанням” та “показники успішності навчання”. Впевнитися у цьому допомагають відповідні коефіцієнти, один з яких запропонував Дж.Юл.

Позначимо символами a, b, c, d частоти у клітинках таблиці та розрахуємо коефіцієнт асоціації Q за наступною формулюю:

 

Q = (a d – b c) / (a d + b c)

 

Q = (20х50 – 30х0) / (20х50 + 30х0) = 1000 / 1000 = 1

 

В даному випадку Q набуває максимального значення, тобто фіксує максимально можливу пряму залежність між ознаками (зворотній максимальній залежності відповідатиме Q = -1), тому що одна з частот дорівнює нулю. Це означає, що за умови високої задоволеності навчанням має місце висока навчальна успішність, але зворотне не буде вірним (висока навчальна успішність може обумовлювати як високу, так й низьку задоволеність навчанням). Таким чином, Q – показник одностороннього зв’язку [87, с.86-87].

На відміну від Q, коефіцієнт контингенції Ф досягає значення +1, коли b=c=0:

________________________________________

Q = (a d – b c) / Ö (a +b) (c + d) (a +c) (b + d)

Ф є показником двостороннього зв’язку: ½Ф½ £ ½Q. Якщо ½Ф½³ 0,5, можна вважати, що надійно встановлений двосторонній зв’язок. Якщо Ф є малим, розраховують Q, щоб встановити, чи є хоча б односторонній зв’язок.

Якщо необхідно встановити кореляційний зв’язок між ознаками, кожна з яких має більше за двох градацій, можна застосувати критерій Пірсона c2 та засновані на ньому коефіцієнти спряженості Пірсона, коефіцієнти Чупрова та Крамера.

Наприклад, відомо, що існує залежність між освітою батьків та освітою дітей. Нехай ми маємо дані двомірного розподілення за ознаками “освіта респондента” та “освіта батька”, одержані в результатів опитування 100 осіб; кожна ознака включає три градації - “вища”, “середня спеціальна”, “середня”. Побудуємо таблицю спряженості, де відобразимо ці дані (див. таблицю 18).

Таблиця 18

Таблиця спряженості ознак “освіта респондентів” та “освіта батька”

Освіта батька Освіта респондентів
вища середня спеціальна середня Разом
Вища
Середня спеціальна
Середня
Разом

 

Для з’ясування того, чи не є зв’язок між змінними випадковим, розрахуємо c2 за наступною формулою:

k _ _

c2 = S (ni – ni)2 / ni , де

i=1

ni - частота, яка спостерігається, та зафіксована у і-й графі,

-____

ni – частота, яка очікується для і-ї графи (теоретична частота),

 

k – кількість граф

 

У наведеній формулі теоретичні частоти відповідають такому розподіленню, за яким між ознаками не існує зв’язку. Значення теоретичної частоти є добутком маргінальних частот (частоти у крайніх рядках та стовпцях), що відповідають значенню ознаки у графі, поділеного на кількість респондентів.

 

Наприклад, для частоти у першій графі (n11) теоретична частота дорівнюватиме:

_

n11 = 50х60 / 100 = 3000 / 100 = 30

c2 = (45-30)2 / 30 + (5-18)2 / 18 + (10 – 12)2 /12 + ...+ (5-20)2 /20 » 49,76

 

Статистична значимість критерію c2 залежіть від кількості градацій кожної з ознак, тобто граф таблиці, що виражається у показнику кількості ступенів свободи та позначається df (degrees of freedom).

 

df = (c-1) (l-1), де с – кількість рядків, l – кількість стовпців

 

df = (3-1) (3-1) = 4

 

Встановлення значимості c2 полягає у порівнянні одержаного його значення із так званим критичним - c2кр (воно відповідає теоретичному розподіленню частот, тобто такому, за яким зв’язок між ознаками відсутній). c2 кр знаходиться по спеціальній таблиці для конкретного числа ступенів свободи та рівня значимості a[4].

У нашому випадку для a=0,05, тобто з ймовірністю 95% можна констатувати значимість зв’язку між змінними, тому що c2 > c2кр (c2кр = 9,49).

Як було зазначено вище, на c2 засновані ряд коефіцієнтів, в тому числі коефіцієнт спряженості Пірсона, коефіцієнти Чупрова та Крамера.

Коефіцієнт середньої квадратичної спряженості Пірсона розраховується за наступною формулою:

__________

С = Ö c2 / (n + c2)

 

Сmin = 0 (якщо зв’язок відсутній), але С max не досягає 1.

 

Цього недоліку позбавлений коефіцієнт Чупрова:

________________

Т = Ö c2 / [n (c-1) (l-1)]1/2

 

Тmin = 0, Т max = 1, але тільки якщо с=l.

Запропонований Крамером коефіцієнт зв’язку, на відміну від попереднього, не залежіть від виду таблиці:

__________________

К = Ö c2 / [n min (c-1) (l-1)]

Коефіцієнти рангової кореляції

Наведені вище коефіцієнти зв’язку засновані на принципі сумісної появи подій. Вони придатні для будь-яких ознак – номінальних, порядкових, метричних. Для порядкових та метричних ознак також можуть застосовуватися коефіцієнти, засновані на принципі коваріації: вони встановлюють відповідність варіації однієї ознаки варіації іншої.

Одним з можливих способів встановлення зв’язку між упорядкованими за двома критеріями значеннями ознак є коефіцієнт Спірмена.

Наприклад, ми маємо результати ранжування цінностей двома групами респондентів: респонденти першої групи мають вищу освіту, другої – середню (дивись таблицю 19). Необхідно встановити, чи є суттєвими розбіжності у рангах, які присвоїли цінностям респонденти з вищою та середньою освітою.

 

Таблиця19