Задача 4.

 

Исследуется зависимость коэффициента усвоения знаний, выраженного в процентах (%) от уровня посещаемости занятий (%) в группе из четырнадцати учащихся (- порядковый номер учащегося). Статистические данные приведены в таблице.

Требуется:

1) Найти оценки параметров линейной регрессии на . Построить диаграмму рассеяния и нанести прямую регрессии на диаграмму рассеяния.

2) На уровне значимости проверить гипотезу о согласии линейной регрессии с результатами наблюдений.

3) С надежностью найти доверительные интервалы для параметров линейной регрессии.

 

4.0.

 

Найдем точечные статистические оценки и параметров и линейной регрессии Y на X: .

Для уравнения прямой регрессии по статистическим данным таблицы 4.0 найдем оценки и ее параметров методом наименьших квадратов. Применим известные формулы

, где , ;

Вычисления организуем в форме следующей расчетной таблицы:

i
50,714 34,143 1836,071 2764,286 1226,286

Таким образом, , , , , .

Далее вычисляем ковариации

;

;

;

и по указанным выше формулам находим

; .

В результате получаем уравнение прямой регрессии

.

Проверим согласованность выбранной линейной регрессии с результатами наблюдений. Для этого решим следующую задачу проверки статистической гипотезы.

На заданном уровне значимости выдвигается гипотеза об отсутствии линейной статистической связи. Для проверки выдвинутой гипотезы используется коэффициент детерминации и применяется статистика Фишера F.

В случае парной линейной регрессии коэффициент детерминации равен квадрату выборочного коэффициента корреляции Пирсона, т.е. .

Статистика F выражается формулой и при условии справедливости гипотезы имеет классическое распределение Фишера с и степенями свободы.

В соответствии с приведенными формулами вычисляем коэффициент детерминации и наблюдаемое значение статистики Фишера:

,

.

 

Критическое значение статистики Фишера находим по таблице квантилей распределения Фишера, исходя из равенства , где p=1-a (порядок квантили), и . В данном случае .

Сравниваем между собой наблюдаемое и критическое значения статистики Фишера. Так как , то выдвинутая гипотеза решительно отвергается, что свидетельствует о согласии линейной регрессивной связи с результатами наблюдений.

Так как линейная регрессия согласуется со статистическими данными, найдем (с надежностью g=0,95 ) доверительные интервалы для параметров и линейной регрессии. Для нахождения доверительных интервалов применим известные формулы:

,

где , - квантиль распределения Стьюдента порядка с k=n-2 степенями свободы, ;

, где .

В данном случае =, ;

;

=.

Применив приведенные выше формулы для доверительных интервалов, окончательно получим

,

.