Примем в качестве факторного признака x ¾ потребление мяса на душу населения в год (кг), а в качестве результативного y ¾ среднюю ожидаемую продолжительность жизни (лет).
Для выявления наличия связи между признаками построим поле корреляции:
Точки поля корреляции расположены близко друг к другу и группируются вокруг некоторой линии. Таким образом, можно сказать, что связь между признаками х и у присутствует. Предположим, что она линейная, т.е. можно построить такую прямую линию, расстояние от всех точек графика до которой будет наименьшим (см. рис. ниже).
Построим уравнение регрессии и определим его параметры.
Уравнением, которое характеризует линейную зависимость между двумя показателями, является уравнение прямой (уравнение однофакторной корреляционной связи):
ўx=a + bx,
Определим параметры a и b с помощью метода наименьших квадратов, для этого решим систему нормальных уравнений:
ìSyx= na + bSx,
í
îSyx x= aSx + bSx2,
где n — количество наблюдений.
Построим рабочую таблицу для промежуточных расчетов:
№ п/п | x | y | x2 | xy |
78,2 | 8132,8 | |||
77,2 | 5558,4 | |||
70,9 | 4183,1 | |||
77,2 | 6639,2 | |||
75,7 | 7418,6 | |||
78,2 | 6177,8 | |||
67,6 | ||||
68,4 | 3830,4 | |||
66,6 | 3063,6 | |||
69,9 | 3005,7 | |||
76,7 | 8743,8 | |||
68,8 | 2545,6 | |||
76,8 | 4838,4 | |||
78,1 | 7107,1 | |||
73,9 | ||||
78,6 | 4401,6 | |||
Сумма | 1483,8 | |||
Ср.знач. | 73,2 | 74,19 | - | 5502,21 |
Подставим полученные данные в систему нормальных уравнений:
ì1483,8= 20a + 1464b,
í
î110044= 1464a + 116828b.
Решив систему уравнений, получим а = 63,21, b = 0,15. Следовательно, уравнение регрессии имеет вид:
ўx=63,21 + 0,15x.
Таким образом, можно утверждать, что связь между душевым потреблением мяса и ожидаемой продолжительностью жизни прямая (т.к. b > 0), причем при увеличении потребления мяса на 1 кг на душу населения в год, средняя продолжительность жизни увеличивается на 0,15 лет.
Для оценки тесноты связи между признаками определим линейный коэффициент корреляции: