Предположим, что в некотором опыте наблюдаются две случайные величины X и Y. Так как X и Y обусловлены одним и тем же опытом, то можно предположить, что между ними может существовать определенная связь, а X и Y, как говорят скоррелированы (согласованы) друг с другом. Пусть наблюдаемые значения этих переменных.
Пример 13.На основании корреляционной таблицы для двумерной случайной величины (Х,Y) составить уравнения прямых регрессий Y на Х и Х на Y, установить тесноту связи между признаками X и Y.
Решение. Для каждого значения , т.е. для каждой строки корреляционной таблицы, с учетом равенства где т – число интервалов по переменной Y (в нашем случае т=5), вычисляем групповые средние
В результате получим:
Вычисленные групповые средние изобразим графически в виде ломанной, как первым приближением к эмпирической линии регрессии Y на Х.
Аналогично для каждого значения , т.е. для каждого столбца корреляционной таблицы вычисляем групповые средние
с учетом равенства, где l – число интервалов по переменной Х (в нашем случае l=5).
Геометрическое изображение в виде ломанной, проходящей через точки с абсциссами:
явится первым приближением к эмпирической линии регрессии Х на Y.
По виду ломанных (которые мы предлагаем нарисовать самостоятельно) можно предположить наличие линейной корреляционной зависимости как Y на Х так и Х на Y. Достоверность предположения о форе корреляционной зависимости будет тем выше, чем больше объем выборки п:
Согласно высказанного предположения уравнение линий регрессий будем искать в виде
(Y на Х);
(Х на Y).
Для нахождения коэффициентов и линий регрессии воспользуемся методом наименьших квадратов. В результате получим линии регрессии Y на Х и Х на Y, вида
где коэффициенты регрессий вычисляем по формулам:
Выборочные дисперсии переменных Х и Y находятся по формулам:
Используя данные корреляционной таблицы, находим выборочные характеристики и параметры уравнений регрессии:
Используя формулы, получим уравнения регрессий:
или
или
Наиболее подходящим показателем тесноты линейной связи является численное значение выборочного коэффициента корреляции, который вычисляется по одной из формул:
Из первых двух формул для вычисления коэффициента легко может быть получена компактная формула: