Исследуется зависимость коэффициента усвоения знаний, выраженного в процентах (%) от уровня посещаемости занятий (%) в группе из четырнадцати учащихся (- порядковый номер учащегося). Статистические данные приведены в таблице.
Требуется:
1) Найти оценки параметров линейной регрессии на . Построить диаграмму рассеяния и нанести прямую регрессии на диаграмму рассеяния.
2) На уровне значимости проверить гипотезу о согласии линейной регрессии с результатами наблюдений.
3) С надежностью найти доверительные интервалы для параметров линейной регрессии.
4.0.
Найдем точечные статистические оценки и параметров и линейной регрессии Y на X: .
Для уравнения прямой регрессии по статистическим данным таблицы 4.0 найдем оценки и ее параметров методом наименьших квадратов. Применим известные формулы
, где , ;
Вычисления организуем в форме следующей расчетной таблицы:
i | |||||
50,714 | 34,143 | 1836,071 | 2764,286 | 1226,286 |
Таким образом, , , , , .
Далее вычисляем ковариации
;
;
;
и по указанным выше формулам находим
; .
В результате получаем уравнение прямой регрессии
.
Проверим согласованность выбранной линейной регрессии с результатами наблюдений. Для этого решим следующую задачу проверки статистической гипотезы.
На заданном уровне значимости выдвигается гипотеза об отсутствии линейной статистической связи. Для проверки выдвинутой гипотезы используется коэффициент детерминации и применяется статистика Фишера F.
В случае парной линейной регрессии коэффициент детерминации равен квадрату выборочного коэффициента корреляции Пирсона, т.е. .
Статистика F выражается формулой и при условии справедливости гипотезы имеет классическое распределение Фишера с и степенями свободы.
В соответствии с приведенными формулами вычисляем коэффициент детерминации и наблюдаемое значение статистики Фишера:
,
.
Критическое значение статистики Фишера находим по таблице квантилей распределения Фишера, исходя из равенства , где p=1-a (порядок квантили), и . В данном случае .
Сравниваем между собой наблюдаемое и критическое значения статистики Фишера. Так как , то выдвинутая гипотеза решительно отвергается, что свидетельствует о согласии линейной регрессивной связи с результатами наблюдений.
Так как линейная регрессия согласуется со статистическими данными, найдем (с надежностью g=0,95 ) доверительные интервалы для параметров и линейной регрессии. Для нахождения доверительных интервалов применим известные формулы:
,
где , - квантиль распределения Стьюдента порядка с k=n-2 степенями свободы, ;
, где .
В данном случае =, ;
;
=.
Применив приведенные выше формулы для доверительных интервалов, окончательно получим
,
.