КОРРЕЛЯЦИОННЫЙ АНАЛИЗ

Корреляционный анализ — это статистическая методика выявления зависимости между двумя случайными величинами.

Динамическая зависимость однозначная. Так, зная закон движения грузовика (s=vt), можно вполне однозначно вычислить пройденный к любому моменту времени путь. График зависимости можно построить, рассчитав координаты нескольких точек. Для равномерного движения графиком будет наклонная прямая.

Статистическая зависимость неоднозначна, потому, что завуалирована множеством неизвестных нам случайных факторов. Примером может служить зависимость между ростом и весом человека. Встречаются люди с одинаковым ростом, но с разным весом, а также люди с разным весом, но с одинаковым ростом. График в таких случаях построить невозможно, поскольку точки располагаются в координатной плоскости в виде беспорядочно облачка. На рисунке 5 показаны точечные диаграммы: а) неполная положительная корреляция — прослеживается тенденция роста величины y с ростом x; б) неполная отрицательная корреляция; в) отсутствие корреляции — облачко круглое. В статистике такую зависимость называют корреляцией.

В частном случае, когда корреляция полная, мы приходим к динамической зависимости.

Корреляция устанавливается аналитически вычислением так называемого коэффициента корреляции по формуле Пирсона

.

Величина коэффициента r находится на отрезке [-1; 1]. Крайние значения отвечают полной корреляции. Корреляция отсутствует, если r=0. При других значениях корреляция неполная. Отрицательному значению r отвечает отрицательная корреляция. Ниже в таблице приводится качественная интерпретация различных интервалов значений модуля коэффициента r.

Значение |r| (0; 0,3] (0,3; 0,65] (0,65; 0,9] (0,9; 1)
Интерпретация корреляции Нет Слабая, практически нет Умеренная Сильная Очень сильная Полная

Следует заметить, что формула коэффициента корреляции довольно сложна и требует большого числа промежуточных расчетов. Покажем методику расчетов по этой формуле.

Предварительно вычисляются средние арифметические значения для обеих случайных величин. Достраиваем таблицу данных и в дополнительных столбцах зафиксируем результаты промежуточных расчетов (Таблица данных выделена жирным шрифтом).

Икс Игрек x-xср y-yср (x-xср)2 (y-yср)2 (х-хср,)(y-уср)
-6 -9
-2 -11
-4 -16
-3 -10
-7 -11
-2 -9
Средние 9 20 Суммы по столбцам: 200 1378 369

Найденные суммы по трем последним столбцам подставляются в формулу:

.