Пусть имеем две случайные величины х и y с заданными математическими ожиданиями MX и MY и средними квадратическими отклонениями и .
Величина
(а)
носит название ковариации.
Пронормируем случайные величины Х и Y, т.е. перейдем к новым случайным величинам X' и Y', математические ожидания которых равны нулю, а дисперсии-единице. Тогда
cov(X' Y') нормированных случайных величии X' и Y' называется коэффициентом корреляции,
т.е. (b)
или
.
Коэффициент корреляции указывает на тесноту связи между двумя случайными величинами и изменяется от -1 до +1. При прямой линейной зависимости, т. е. когда с возрастанием значений , увеличиваются значения . При обратной линейной зависимости, т. е. когда с возрастанием значений, значения уменьшаются . Если х и у независимы, то = 0.
При каждому значению соответствует несколько значений . Условным средним называется среднее значение из величин при данном значении . Условным средним называется среднее значение из величин при данном значении . Две линии, соединяющие все значения и , называются линиями регрессии.
Коэффициент корреляции , когда с увеличением значений значения условных средних увеличиваются.
Коэффициент корреляции , когда с увеличением значений значения условных средних уменьшаются.
Если линиями регрессии являются прямые линии, то корреляция называется прямолинейной.
Ниже ограничимся рассмотрением только прямолинейной корреляции.
Теоретическое вычисление коэффициента корреляции по формуле (b) в большинстве случаев вызывает много трудностей. Поэтому для его определения обычно пользуются результатами экспериментальных данных.