Решение.

а) В прямоугольной системе координат строим график зависимости переменных X и Y (рис.4). Для удобства выделим по пять интервалов изменения этих переменных, используя формулы:

и

Для переменной Х получим:

Длину интервала округлим в сторону увеличения, т.е. положим В результате получим следующие границы интервалов:

-10; -2; 6; 14; 22; 30.

Аналогичные расчеты производим для переменной Y:

 

Границы интервалов составят:

-4; 1; 6; 11; 16; 21.

На график наносим точки координаты которых соответствуют значениям переменных X и Y.

 

Рис.4

 

Визуально анализируя характер расположения точек на графике (рис.4), приходим к выводу, что связь между переменными X и Y может быть выражена линейным уравнением регрессии

б) Параметры уравнения регрессии находим методом наименьших квадратов, путем составления и решения системы нормальных уравнений:

 

Составим расчетную таблицу 10.

Таблица 10

           
-10 -2,6 6,76 26,0
-8 -3,2 10,24 25,6
-6 -2,3 5,29 13,8
-4 -2,0 4,00 8,0
-2 2,3 5,29 -4,6
-0,5 0,25 0,0
4,0 16,00 8,0
5,9 34,81 23,6
5,3 28,09 31,8
6,7 44,89 53,6
5,4 29,16 54,0
9,6 92,16 115,2
10,3 106,09 144,2
11,7 136,89 187,2
12,8 163,84 230,4
13,4 179,56 268,0
10,5 110,25 231,0
11,4 129,96 273,6
14,5 210,25 377,0
17,8 316,84 498,4
  1630,62 2564,8

 

Тогда система примет вид:

 

Решим систему по формулам Камера:

 

 

 

Следовательно,

 

Таким образом, уравнение регрессии Y на X имеет вид:

 

Построим линию регрессии Y на X по таблице:

X -3,57
  1,86

Линия регрессии изображена на рисунке 4.

в) При линейной зависимости степень тесноты связи между X и Y определяется с помощью коэффициента корреляции:

 

где средние арифметические значения:

 

 

 

Найдем:

 

 

Вычислим средние квадратические отклонения и :

 

 

Отсюда,

Т.к. то между признаками связь очень тесная, близкая к линейной функциональной.

Коэффициент детерминации равен

г) Оценить значимость коэффициента корреляции.

Нулевая гипотеза - переменная X не оказывает существенного влияния на Y.

Конкурирующая гипотеза

Для проверки нулевой гипотезы применим критерий Стьюдента. Уровень значимости Коэффициент корреляции Найдем наблюдаемое значение критерия:

 

По таблице критических точек распределения Стьюдента по уровню значимости и числу степеней свободы найдем критическую точку:

двусторонней критической области.

Т.к. то нулевую гипотезу отвергаем.

Вывод: выборочный коэффициент корреляции значим, случайные величины X и Y коррелированы.

Задача 3.Известно, что между X и Y существует линейная корреляционная зависимость (табл.11).

а) найти уравнение прямой регрессии;

б) построить уравнение эмпирической линии регрессии и случайные точки выборки.

Таблица 11

XY 2,3, 3,8 5,3 6,8 8,3 9,8 11,3 12,8  
- - - - -
- - - - - -
- - - - -
- - - - -
- - - - -
- - - - - -
   

а) Уравнение прямой регрессии Y на X имеет вид:

 

где - условная средняя;

и - выборочные средние признаков X и Y;

и - выборочные средние квадратичные отклонения;

- выборочный коэффициент корреляции.

Найдем выборочные средние и . (Целые числа внутри таблицы являются кратностями значений соответствующих случайных точек):

Определим средние арифметические значения , и :

 

Определим дисперсию и ковариацию.

 

Дисперсии:

Ковариация: Находим и

 

Определим коэффициент корреляции:

 

Вычислим значение произведения:

 

Т.к. то связь достаточно вероятна.

Уравнение прямой регрессии Y на X:

 

б) Построим линию регрессии по двум точкам:

X -9,79
  1,097

и случайные точки выборки (рис. 5).

 

Рис.5