ПОСТРОЕНИЕ РЕГРЕССИОННОЙ ПРЯМОЙ ПО СГРУППИРОВАННЫМ ДАННЫМ. ВЫБОРОЧНЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ

Предположим, что в некотором опыте наблюдаются две случайные величины X и Y. Так как X и Y обусловлены одним и тем же опытом, то можно предположить, что между ними может существовать определенная связь, а X и Y, как говорят скоррелированы (согласованы) друг с другом. Пусть наблюдаемые значения этих переменных.

Пример 13.На основании корреляционной таблицы для двумерной случайной величины (Х,Y) составить уравнения прямых регрессий Y на Х и Х на Y, установить тесноту связи между признаками X и Y.

Решение. Для каждого значения , т.е. для каждой строки корреляционной таблицы, с учетом равенства где т – число интервалов по переменной Y (в нашем случае т=5), вычисляем групповые средние

 

В результате получим:

 

Вычисленные групповые средние изобразим графически в виде ломанной, как первым приближением к эмпирической линии регрессии Y на Х.

Аналогично для каждого значения , т.е. для каждого столбца корреляционной таблицы вычисляем групповые средние

 

с учетом равенства, где l – число интервалов по переменной Х (в нашем случае l=5).

Геометрическое изображение в виде ломанной, проходящей через точки с абсциссами:

 

явится первым приближением к эмпирической линии регрессии Х на Y.

По виду ломанных (которые мы предлагаем нарисовать самостоятельно) можно предположить наличие линейной корреляционной зависимости как Y на Х так и Х на Y. Достоверность предположения о форе корреляционной зависимости будет тем выше, чем больше объем выборки п:

 

Согласно высказанного предположения уравнение линий регрессий будем искать в виде

(Y на Х);

(Х на Y).

Для нахождения коэффициентов и линий регрессии воспользуемся методом наименьших квадратов. В результате получим линии регрессии Y на Х и Х на Y, вида

 

 

где коэффициенты регрессий вычисляем по формулам:

 

 

Выборочные дисперсии переменных Х и Y находятся по формулам:

 

 

Используя данные корреляционной таблицы, находим выборочные характеристики и параметры уравнений регрессии:

 

 

 

Используя формулы, получим уравнения регрессий:

или

или

Наиболее подходящим показателем тесноты линейной связи является численное значение выборочного коэффициента корреляции, который вычисляется по одной из формул:

 

Из первых двух формул для вычисления коэффициента легко может быть получена компактная формула: