Среднее значение

Среднее значение. Разброс значений вокруг предсказанного небольшой.

На графике получена горизонтальная полоса, значит остатки представляют собой случайные величины и МНК оправдан, теоретические значения у хорошо аппроксимируют фактические значения у. Оценим статистическую значимость уравнения множественной регрессии.

Определим, какое уравнение лучше использовать для прогноза: а) парную регрессию Y на X1; б) парную регрессию Y на X2; в) множественную регрессию. а) парная регрессия Y на X1: Рассчитаем F-критерий: =526,57 =4,13 Так как > , то - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. б) парная регрессия Y на X2: =18,92 =4,13 Так как > , то - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. в) множественная регрессия: Коэффициент детерминации определим по формуле: =0,904 Он показывает долю вариации результативного признака под воздействием изучаемых факторов.

Следовательно, около 90,4% вариация зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.

Проверку значимости уравнения регрессии произведем на основе вычисления F-критерия Фишера: 155,38. Для уровня значимости α = 0,05 и при степенях свободы 2, 33 табличное значение статистики Фишера Fтаб = 3,3. Так как Fрас  Fтабл, уравнение регрессии следует признать адекватным, статистически значимым.

Матрица парных коэффициентов корреляции Из таблицы видно, что в соответствии со шкалой Чеддока связь между и можно оценить как сильную, между и - как средюю, между и связь средняя.

Таким образом, лучше использовать для прогноза парную регрессию Y на X1. 4.Проведем тестирование ошибок уравнения множественной регрессии на гетероскедастичность, применив тест Гельфельда-Квандта.

Проведем тестирование ошибок уравнения множественной регрессии на гетероскедастичность, применив тест Гельфельда-Квандта: Тест Гельфельда-Квандта предусматривает осуществление следующих шагов: 1. Упорядочить наблюдения по убыванию той независимой переменной, относительно которой есть подозрение на гетероскедастичность. 2. Опустить v наблюдений, оказавшихся в центре (v должно быть примерно равно четверти общего количества наблюдений n). 3. Оценить отдельно обыкновенным методом наименьших квадратов регрессии на первых (n- v)/2 наблюдениях и на последних (n- v)/2 наблюдениях при условии, что (n- v)/2 больше числа оцениваемых параметров k. 4. Пусть и - суммы квадратов остатков от первой и второй регрессий соответственно.

Тогда статистика Q= / , будет удовлетворять F – распределению с ((n-v-2k)/2; (n-v-2k)/2) степенями свободы.

При Q гипотеза об однородности выборочной дисперсии принимается, в противном случае (с ростом Q) отклоняется.

В нашем случае число объясняющих переменных k=2, количество исходных данных в выборке n=36. Упорядочим наблюдения по убыванию независимой переменной - суточная калорийность питания населения, Ккал на душу населения, относительно которой есть подозрение на гетероскедастичность. Опустим 10 наблюдений, оказавшихся в центре, т.е. v=10. При значении v=10 получим суммы квадратов остатков от первой и второй регрессий соответственно =0,046, =0,08. Статистика Q= / =0,046/0,08=0,575 не удовлетворяет F – распределению с (11,11) степенями свободы. =2,83, и гипотеза об однородности выборочной дисперсии должна быть принята.

Проверим модель на отсутствие автокорреляции: Проверим независимость по критерию Дарбина-Уотсона. =1,746 Сформулируем гипотезы: - в остатках нет автокорреляции; - в остатках есть положительная автокорреляция; - в остатках есть отрицательная автокорреляция.

Зададим уровень значимости. По таблице значений критерия Дарбина-Уотсона определим для числа наблюдений n=36 и числа независимых переменных модели =2 критические значения и. Получим следующие промежутки внутри интервала. Фактическое значение попадает в промежуток от до. Следовательно, нет оснований отклонять гипотезу об отсутствии автокорреляции в остатках.