1) Линейный коэффициент корреляции может принимать значения в пределах от –1 до +1.
2) Если , то связь между признаками функциональная, т. е. на результативный признак влияет только рассматриваемый факторный признак и больше ничего, если r = 0, то связь между признаками отсутствует.
3) Если r > 0, то связь между признаками прямая, если r < 0, то связь – обратная.
4) Выделяют следующие промежутки для r:
связь между признаками фактически отсутствует;
связь слабая;
связь умеренная;
связь сильная.
Рис. 2. Примеры расположения точек на графике и значений коэффициента корреляции
Для оценки существенности линейного коэффициента корреляции r используют t – критерий Стьюдента. При этом выдвигается гипотеза о равенстве коэффициента корреляции нулю.
Проверка гипотезы:
1. Вычисляют фактические значения t-критерия для r:
(такая формула применяется при небольшом объеме выборки).
2. По таблице t-распределения Стьюдента с учетом принятого уровня значимости или и числе степеней свободы определяют .
3. Если , то гипотеза отвергается, что свидетельствует о значимости коэффициента корреляции.
Корреляционное отношение определяется по формулам:
η = или η = ,
где – межгрупповая дисперсия результативного признака, вызванная влиянием признака-фактора;
– общая дисперсия результативного признака;
– средняя из внутригрупповых дисперсий результативного признака.
Вычисление корреляционного отношения требует достаточно большого объема информации, которая должна быть представлена в форме групповой таблицы или в форме корреляционной таблицы, т. е. обязательным условием является группировка данных по признаку-фактору.
По несгруппированным данным эмпирическое корреляционное отношение может быть рассчитано по следующей формуле:
.
где y – эмпирические (фактические) значения результативного признака;
– среднее значение результативного признака;
– выравненные значения результативного признака, вычисленные по аналитическому уравнению.
Корреляционное отношение в квадрате (), а для парной связи линейный коэффициент корреляции в квадрате () называют коэффициентом детерминации (причинности), он отражает долю факторной дисперсии в общей дисперсии.
Коэффициент детерминации (D) показывает, на сколько процентов изменение среднего значения результативного признака определяется влиянием данного факторного признака.
В практике могут быть использованы и другие показатели для определения степени тесноты связи.
Элементарной характеристикой степени тесноты связи является коэффициент Фехнера:
,
где na – количество совпадений знаков отклонений индивидуальных величин факторного признака х и результативного признака у от их средней арифметической величины (например, «плюс» и «плюс», «минус» и «минус», «отсутствие отклонения» и «отсутствие отклонения»);
nb – количество несовпадений знаков отклонений индивидуальных значений признаков от значения их средней арифметической.
Коэффициент Фехнера используют при небольшом объеме исходной информации. Он изменяется в пределах от –1 до 1.
Для определения тесноты связи как между количественными, так и между качественными признаками, при условии, что значения этих признаков можно проранжировать по возрастанию или убыванию, используется коэффициент корреляции рангов Спирмэна:
,
где di – разность между величинами рангов признака-фактора и результативного признака;
n – число показателей (рангов) изучаемого ряда.
Он варьирует в пределах от –1 до 1.