а) В прямоугольной системе координат строим график зависимости переменных X и Y (рис.4). Для удобства выделим по пять интервалов изменения этих переменных, используя формулы:
и
Для переменной Х получим:
Длину интервала округлим в сторону увеличения, т.е. положим В результате получим следующие границы интервалов:
-10; -2; 6; 14; 22; 30.
Аналогичные расчеты производим для переменной Y:
Границы интервалов составят:
-4; 1; 6; 11; 16; 21.
На график наносим точки координаты которых соответствуют значениям переменных X и Y.
Рис.4
Визуально анализируя характер расположения точек на графике (рис.4), приходим к выводу, что связь между переменными X и Y может быть выражена линейным уравнением регрессии
б) Параметры уравнения регрессии находим методом наименьших квадратов, путем составления и решения системы нормальных уравнений:
Составим расчетную таблицу 10.
Таблица 10
-10 | -2,6 | 6,76 | 26,0 | ||
-8 | -3,2 | 10,24 | 25,6 | ||
-6 | -2,3 | 5,29 | 13,8 | ||
-4 | -2,0 | 4,00 | 8,0 | ||
-2 | 2,3 | 5,29 | -4,6 | ||
-0,5 | 0,25 | 0,0 | |||
4,0 | 16,00 | 8,0 | |||
5,9 | 34,81 | 23,6 | |||
5,3 | 28,09 | 31,8 | |||
6,7 | 44,89 | 53,6 | |||
5,4 | 29,16 | 54,0 | |||
9,6 | 92,16 | 115,2 | |||
10,3 | 106,09 | 144,2 | |||
11,7 | 136,89 | 187,2 | |||
12,8 | 163,84 | 230,4 | |||
13,4 | 179,56 | 268,0 | |||
10,5 | 110,25 | 231,0 | |||
11,4 | 129,96 | 273,6 | |||
14,5 | 210,25 | 377,0 | |||
17,8 | 316,84 | 498,4 | |||
1630,62 | 2564,8 |
Тогда система примет вид:
Решим систему по формулам Камера:
Следовательно,
Таким образом, уравнение регрессии Y на X имеет вид:
Построим линию регрессии Y на X по таблице:
X | -3,57 | |
1,86 |
Линия регрессии изображена на рисунке 4.
в) При линейной зависимости степень тесноты связи между X и Y определяется с помощью коэффициента корреляции:
где средние арифметические значения:
Найдем:
Вычислим средние квадратические отклонения и :
Отсюда,
Т.к. то между признаками связь очень тесная, близкая к линейной функциональной.
Коэффициент детерминации равен
г) Оценить значимость коэффициента корреляции.
Нулевая гипотеза - переменная X не оказывает существенного влияния на Y.
Конкурирующая гипотеза
Для проверки нулевой гипотезы применим критерий Стьюдента. Уровень значимости Коэффициент корреляции Найдем наблюдаемое значение критерия:
По таблице критических точек распределения Стьюдента по уровню значимости и числу степеней свободы найдем критическую точку:
двусторонней критической области.
Т.к. то нулевую гипотезу отвергаем.
Вывод: выборочный коэффициент корреляции значим, случайные величины X и Y коррелированы.
Задача 3.Известно, что между X и Y существует линейная корреляционная зависимость (табл.11).
а) найти уравнение прямой регрессии;
б) построить уравнение эмпирической линии регрессии и случайные точки выборки.
Таблица 11
XY | 2,3, | 3,8 | 5,3 | 6,8 | 8,3 | 9,8 | 11,3 | 12,8 | |
- | - | - | - | - | |||||
- | - | - | - | - | - | ||||
- | - | - | - | - | |||||
- | - | - | - | - | |||||
- | - | - | - | - | |||||
- | - | - | - | - | - | ||||
а) Уравнение прямой регрессии Y на X имеет вид:
где - условная средняя;
и - выборочные средние признаков X и Y;
и - выборочные средние квадратичные отклонения;
- выборочный коэффициент корреляции.
Найдем выборочные средние и . (Целые числа внутри таблицы являются кратностями значений соответствующих случайных точек):
Определим средние арифметические значения , и :
Определим дисперсию и ковариацию.
Дисперсии:
Ковариация: Находим и
Определим коэффициент корреляции:
Вычислим значение произведения:
Т.к. то связь достаточно вероятна.
Уравнение прямой регрессии Y на X:
б) Построим линию регрессии по двум точкам:
X | -9,79 | |
1,097 |
и случайные точки выборки (рис. 5).
Рис.5