Парная корреляционная связь

Парная корреляция:при определении связи между двумя переменными не контролируются их связи с другими переменными, включенными в анализ.

Диаграмма рассеивания:визуальное отражение связи между двумя переменными (принято, что независимая переменная должна соответствовать горизонтальной оси диаграммы, а зависимая переменная - вертикальной).

Каждому наблюдению на диаграмме соответствует одна точка. Если в расположении точек не прослеживается никаких закономерностей, то две переменные не связаны. Однако, как правило, некоторая связь между переменными наблюдается и чаще всего эта связь близка по форме к линейной. В этом случае расположение точек на диаграмме рассеивания напоминает эллипс, вытянутый из левого нижнего угла в правый верхний в случае положительной корреляции переменных и из левого верхнего угла в правый нижний - в случае отрицательной корреляции. Чем более вытянут эллипс, чем более он отличается от окружности, тем более сильной является линейная корреляционная связь. Расположение точек может принимать также и другие упорядоченные формы, отличающиеся от эллипса, например, форму треугольника. Это означает, что связь между переменными является нелинейной, что затрудняет использование стандартных статистических методов.

 

Коэффициент корреляции:отражает силу линейной связи между двумя переменными.

Этот способ определения связи не является столь наглядным как диаграммы рассеивания, но зато позволяет точно оценить силу линейной связи. Коэффициент корреляции является нормированной величиной, он может меняться от -1 до 1. Значения, которые по модулю близки к 1, соответствуют сильной линейной связи, а значения, близкие к нулю, соответствуют отсутствию значимой линейной связи. Если коэффициент корреляции равен по модулю 1, то это означает, что связь между переменными является строго линейной, что практически невозможно для маркетинговых показателей.

Сила связи может определяться:

- как по самому коэффициенту корреляции;

- так и по соответствующему ему уровню значимости(если эмпирический уровень значимости меньше критических значений, то корреляция является статистически достоверной).

Параметрический коэффициент корреляции Пирсона -для переменных, измеренных в интервальной шкале или относительной шкале.

Непараметрический коэффициент корреляции Спирмена- для переменных, измеренных в порядковой шкале.

Существуют также коэффициенты корреляции для переменных, измеренных в шкале наименований, но их мы в данном разделе не рассматриваем.

Необходимо помнить о том, что различия между интервальной и порядковой шкалой зачастую являются нечеткими, к тому же коэффициент Спирмена, как правило, незначительно отличается от коэффициента Пирсона, рассчитанного для тех же данных.

Корреляционная матрица: состоит из коэффициентов корреляции для всех возможных пар переменных (так как в анализ часто включено одновременно более двух переменных).

Количество столбцов в корреляционной матрице равно количеству строк, причем каждый столбец, равно как и каждая строка, соответствует одной из переменных. Каждая ячейка корреляционной матрицы содержит коэффициент корреляции между двумя переменными. На главной диагонали матрицы находятся единицы, так как коэффициент корреляции переменной самой с собой равен 1.