Теоретические сведения

Под корреляцией понимается всякая связь между двумя или несколькими исследуемыми явлениями. Она может быть детерминистической или случайной (вероятностной). Первый тип связи определяется строгими закономерностями, обычно описываемыми физико-химическими формулами. Так закон Ома в его тривиальной форме определяет жесткую связь между разностью потенциалов, силой тока и электрическим сопротивлением. Второй тип связи только предполагается, т. к. отсутствуют теоретические предпосылки, свидетельствующие о наличие такой связи.

При корреляционном анализе проверяется лишь сам факт связи, т. е. статистическая гипотеза об отсутствии (или наличии) связи. Сама природа величин, между которыми такая случайная связь предполагается, позволяет судить о ней как о вероятностной. Результат корреляционного анализа также носит статистический характер, так как заключение о наличии или отсутствии связи принимается с некоторой наперед заданной доверительной вероятностью.

Примером задачи корреляционного анализа может служить исследование влияния температурного режима на выход какого-либо химического продукта в сложном технологическом процессе. При этом с увеличением температуры возможно не только повышение скорости исследуемой реакции, но и протекание побочных реакций, а также и обратная реакция разложения продукта. Поэтому связь между температурой и выходом можно охарактеризовать как случайную.

Обычно при корреляционном анализе исследуются только линейные связи между величинами, а статистические критерии свидетельствуют о наличии или отсутствии предполагаемой линейной связи. Поэтому отрицательный ответ при проверке гипотезы о корреляции может означать не только отсутствие связи, но и возможное наличие нелинейной зависимости между исследуемыми величинами.

Для количественной оценки линейной корреляции пользуются выборочным коэффициентом парной корреляции rxy - безразмерной величиной к значениям средних квадратических отклонений исследуемых величин:

  rxy =[n.Σxiyi - ΣxiΣyi] / , (2.1)

где Σ =

Коэффициент корреляции по абсолютной величине не превосходит единицы () и может принимать следующие значения:

1) r x y = 0, этот случай соответствует отсутствию связи между x и y ( рис. 1,а );

2) r x y = +1, между x и y существует строгая положительная линейная связь (рис.1,б );

3) r x y = -1, между x и y существует строгая отрицательная связь ( рис. 1,в ) ;

4) - 1 < r x y < +1; это наиболее часто встречающийся случай, и здесь о корреляции судят уже лишь с точки зрения большей или меньшей вероятности.

Величина коэффициента корреляции служит для оценки тесноты только линейной связи между величинами Х и Y: чем ближе абсолютная величина коэффициента к 1, тем связь сильнее; чем ближе к нулю, тем связь слабее. Если случайные величины Х и Y связаны точной линейной функциональной зависимостью

  , (2.2)

то rXY = (знак «+» или «–» берётся в зависимости от того, а>0 или a<0 ).

Рис.1. Корреляционная зависимость между случайными величинами X и Y

Зависимость коэффициента корреляции проверяется путем сравнения абсолютной величины эмпирического коэффициента корреляции, умноженной на , с его критическими значениями при заданной степени надежности вывода (уровня доверительности) Р. Критические значения произведения ½r½=Hпри числе измерений n до 10 для различных значений надежности вывода составляют: при Р = 0.9 H = 1.65; при Р = 0.95 H = 1.90; при Р= 0.99 H = 2.29.

Если для эмпирического коэффициента корреляции rпроизведение H=½r½окажется больше критического значения H, то с надежностью вывода Рследует отвергнуть гипотезу о некоррелированности рассматриваемых величин.

При инженерных расчетах уровень доверительности Р= 0.95обычно считается достаточным.

 

Пример2.1. Установить зависимость давления насыщенного пара бензола от температуры по экспериментальными данными (табл. 2.1)

Таблица 2.1

Давление насыщенного пара бензола при разных температурах

T, K 270.5 280.8 288.6 299.2 315.4 333.8 353.2
P×10-5, Па 0.0267 0.0533 0.080 0.1333 0.2667 0.5333 1.0133

 

Для определения коэффициента корреляции проводятся предварительные расчеты (см. табл. 2.2).

Таблица 2.2

Данные для расчета коэффициента корреляции

I X = T Y = P X×Y X2 Y2
270.5 0.0007128×1010
280.8 0.0028408×1010
288.6 0.0064000×1010
299.2 0.0177688×1010
315.4 0.0711288×1010
333.8 0.2844088×1010
353.2 1.0267768×1010
S 2141.5 2.106×105 7.052×107 6.609×105 1.4100×1010

 

Коэффициент корреляции рассчитывается по формуле (2.1):

rp,T == 0.909

Значение коэффициента корреляции достаточно велико, чтобы сделать заключение о наличии тесной линейной связи.

Значимость коэффициента корреляции проверяем по значению произведения H

H = 0.909= 2.226

Для уровня доверительности 0.95 табличное значение Hтабл=1.90, следовательно коэффициент корреляции является значимым и гипотеза о линейной связи P и T может быть принята с уровнем доверительности 0.95.