Элементы корреляционного и регрессионного анализа

Модели и основные понятия корреляционного и регрессионного анализа

 

В математическом анализе зависимость между переменными Х и У задается определенной функцией: . И каждому значению Х ставится в соответствие одно единственное значение У. Такую зависимость называют функциональной. Для СВ Х и У не всегда можно установить такую зависимость. Например, рост человека нельзя найти по его весу и наоборот.

Между СВ может существовать связь особого рода, при которой каждому значению одной величины ставится в соответствие распределение другой величины. Такую связь называют стохастической. Изменения СВ У соответствующие изменению Х, разбиваются при этом на стохастическую (связанную с учетом зависимости У от Х) и случайную (связанную со случайными влияниями на СВ Х и У) группы. Если первая компонента отсутствует, то СВ Х и У называются независимыми. Если отсутствует вторая компонента, то между Х и У существует строгая функциональная зависимость.

Математическая статистика и изучает наличие стохастической связи и оценку ее силы. Одной из характеристик стохастической связи является корреляционный момент:

 

Известно, что если СВ Х и У независимы, то корреляционный момент равен 0. Если корреляционный момент равен 0, то СВ могут быть зависимы, но они некоррелированные. Если D(X+Y)≠D(X)+D(Y), то это первый признак того, что между Х и У существует некоторая зависимость.

Пусть имеем выборку объема n,

n→ ( ),

S2= ( )

Если X, Y – независимые СВ, то

2)= 2=

= 2)= 2 2)= →

→ – корреляционный момент.

Если Х, У – независимые СВ, то

Если , то СВ Х,У – не обязательно независимы, но в этом случае Х,У – некоррелированные СВ.

Будем рассматривать случай, когда (существует корреляционная связь).


Для системы двух СВ результаты выборки (наблюдение значений) можно представить в виде таблицы – корреляционной таблицы.

 

Таблица 1

Х У Х у1 у2 уL ni
x1 m11 m12 m1L n1
x2 m21 m22 m2L n2
x k mk1 mk2 m k L n k
m j m1 m2 m L n

 

mij - столько раз будет встречаться (x i, y j)

 

X x1 x k
mi n1 n k

 

 

 

 

 

Каждому значению соответствует вполне определенный закон распределения СВ У. Для этих законов распределения будем брать средние значения.

 

 

Таблица 2

x i x2 xk
       
n i n 1 n 2 n k

 

 

 

 

Таким образом, таблица 2

определяет функциональную зависимость (1).

Если , то в этом случае зависимость между Х и У является корреляционной.

Мы можем аналогично получить зависимость:

 

Уравнения (1) и (2) являются корреляционными или уравнениями регрессии, а называется функцией регрессии У на Х, а – функция регрессии Х на У.