Для исследования степени тесноты связи между качественными признаками, каждый из которых представлен в виде альтернативных признаков, может быть использован коэффициент ассоциации Д. Юлаиликоэффициент контингенции К. Пирсона.
Расчетная таблица в этом случае состоит из четырех ячеек (таблица «четырех полей»), статистическое сказуемое которой схематически может быть представлено в следующем виде:
Признаки | А1 | А0 | Итого |
В1 | а | b | а + b |
В0 | с | d | с + d |
Итого | а + с | b + d | п |
где: а, b, с, d - частоты взаимного сочетания (комбинации) двух альтернативных признаков;
п - общая сумма частот.
Коэффициент ассоциации исчисляется по формуле:
Коэффициент контингенции:
Коэффициент контингенции по значению всегда меньше коэффициента ассоциации. Связь считается достаточно значимой и подтвержденной, если |Ка| > 0,5 или |Кк| >0,3
Для оценки тесноты связи между альтернативными признаками, принимающими любое число вариантов значений, применяется коэффициент взаимной сопряженности К. ПирсонаиА.А.Чупрова.
Первичная статистическая информация для исследования этой связи располагается в форме таблицы:
Признаки | А1 | А2 | А3 | Итого |
B1 | m11 | m12 | m13 | Sm1j |
B2 | m21 | m22 | m23 | Sm2j |
B3 | m31 | m32 | m33 | Sm3j |
Итого | Smi1 | Smi2 | Smi3 | n |
где mij - частоты взаимного сочетания двух атрибутивных признаков;
n - число пар наблюдений.
Коэффициент взаимной сопряженности Пирсона определяется по формуле:
Коэффициент взаимной сопряженности Чупрова:
где f2 - показатель взаимной сопряженности;
К1, К2 – число строк и граф в таблице.
или в общем виде
Коэффициент взаимной сопряженности изменяется от 0 до 1.
Биссериальный коэффициент корреляции – дает возможность оценить связь между качественным альтернативным и количественным варьирующим признаками.
– средняя в группах;
– среднее квадратическое отклонение фактических значений признака от среднего уровня;
p – доля первой группы;
q - доля второй группы;
z – табличные значения Z-распределения в зависимости от p.
В тех случаях, когда одна переменная измеряется в дихотомической шкале (переменная X), а другая в ранговой шкале (переменная Y), используется рангово-бисериальный коэффициент корреляции. Особо необходимо подчеркнуть, то что этот коэффициент изменяется в диапазоне от -1 до +1, его знак для интерпретации результатов не имеет значения. Это еще одно исключение из общего правила.
Расчет этого коэффициента производится по формуле:
- средний ранг по тем элементам переменной Y, которым соответствует код (признак) 1 в переменной X;
- средний ранг по тем элементам переменной Y, которым соответствует код (признак) 0 в переменной X;
N - общее количество элементов в переменной X
Для применения рангово-бисериального коэффициента корреляции необходимо соблюдать следующие условия:
1. Сравниваемые переменные должны быть измерены в разных шкалах одна X - в дихотомической шкале, другая Y - в ранговой шкале
2. Число варьирующих признаков в сравниваемых переменных X и Y должно быть одинаковым
3. Для оценки уровня достоверности рангово-бисериального коэффициента корреляции следует пользоваться формулой (приведенной выше) и таблицей критических значений для t-критерия Стьюдента при k = n – 2.
К показателям степени тесноты связи относят коэффициент корреляции знаков, который был предложен немецким ученым Г.Фехнером (1801-1887). Этот показатель основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Для его расчета вычисляют средние значения результативного и факторного признаков, а затем проставляют знаки отклонений для всех значений взаимосвязанных пар признаков.
Если ввести обозначения:
па - число совпадений знаков отклонений индивидуальных величин от средней,
пв - число несовпадений знаков отклонений, то коэффициент Фехнера можно записать таким образом:
Коэффициент Фехнера может принимать различные значения в пределах от -1 до +1. Если знаки всех отклонений совпадут, то пв = 0 и тогда показатель будет равен 1, что свидетельствует о возможном наличии прямой связи. Если же знаки всех отклонений будут разными, тогда па = 0 и коэффициент Фехнера будет равен -1, что дает основание предположить наличие обратной связи.
Как видно из приведенной формулы для расчета коэффициента Фехнера, величина этого показателя не зависит от величины отклонений факторного и результативного признака от соответствующей средней величины. Поэтому нельзя говорить о степени тесноты корреляционной связи, а тем более об оценке ее существенности на основании только коэффициента Фехнера. При малом объеме исходной информации коэффициент Фехнера практически решает ту же задачу, которая ставится при построении групповых и корреляционных таблиц, т.е. отвечает на вопрос о наличии и направлении корреляционной связи между признаками.
Более совершенным показателем, используемым для измерения тесноты связи как качественных, так и количественных факторов, при условии, что их значении можно проранжировать, является ранговый коэффициент корреляции Спирмена (также называемый коэффициент корреляции рангов Спирмена по имени английского психолога разработавшего данный коэффициент Ч.Спирмена (1863-1945)) который имеет вид:
RiX, RiY - ранги по результативному и факторному признаку;
n – объем изучаемой совокупности.
Ранжирование – процедура упорядочения объектов изучения, которая выполняется на основе предпочтения.
Ранг – это порядковый номер единицы совокупности в ранжированном ряду.
Коэффициент корреляции Спирмена может принимать значения от 0 до ± 1.
Преимущество коэффициента корреляции рангов состоит в том, что на его основе оценивается коррелированность качественных признаков, не имеющих точного количественного измерения.
Коэффициент линейной корреляции был предложен английским статистиком К.Пирсоном. Его интерпретация такова: отклонение признака-фактора от его среднего значения на величину своего среднего квадратического отклонения в среднем по совокупности приводит к отклонению признака-результата от своего значения на r его среднего квадратического отклонения.
Коэффициент корреляции является отвлеченным показателем, характеризующим тесноту связи между переменными, если эта связь линейная. Одной из формул расчета показателя является следующая:
Коэффициент корреляции обладает следующими свойствами:
Принимает значения на отрезке [-1;1]
0 – связь между x и y отсутствует;
(0-0,3] - связь присутствует но она незначительна;
(0,3-0,5] - умеренная связь;
(0,5-0,7] - средняя связь;
(0,7-0,99] - тесная связь;
1 - связь между x и y функциональная.
Следующий коэффициент – коэффициент детерминации, равный квадрату коэффициента корреляции , выраженный в процентах и показывающий, какой процент вариации результата признака объясняется вариацией факторного признака.