Построение и анализ регрессионных моделей

Построение и анализ регрессионных моделей. Построение и анализ моделей парной линейной регрессии. В соответствии с вариантом задания, исходные данные которого приведены в таблице 1: 1. Рассчитать параметры уравнения линейной парной регрессии. 2. Оценить тесноту связи зависимой переменной с объясняющей переменной с помощью показателей корреляции и детерминации. 3. Используя коэффициент эластичности, выполнить количественную оценку влияния объясняющей переменной на результативную переменную. 4. Определить среднюю ошибку аппроксимации. 5. Оценить с помощью F-критерия Фишера статистическую надежность моделирования. Исходные данные для построения модели парной линейной регрессии приведены в таблице 1. Линейное уравнение парной регрессии имеет вид: ŷ=b0+b1x, где ŷ – оценка условного математического ожидания у; b0,b1 – эмпирические коэффициенты регрессии, подлежащие определению.

Таблица 1 – Исходные данные № п/п Область Средний размер назначенных ежемесячных пенсий, у.д.е y Прожиточный минимум в среднем на одного пенсионера в месяц, у.д.е x 1 Орловская 2 Рязанская 3 Смоленская 4 Тверская 5 Тульская 6 Ярославская 250 Эмпирические коэффициенты регрессии b0, b1 будем определять с помощью инструмента «Регрессия» надстройки «Анализ данных» табличного процессора MS Excel. ВЫВОД ИТОГОВ                       Регрессионная статистика           Множественный R 0,038154922         R-квадрат 0,001455798         Нормированный R-квадрат -0,248180252         Стандартная ошибка 7,65655705         Наблюдения 6                     Дисперсионный анализ             df SS MS F Значимость F Регрессия 1 0,341869919 0,34187 0,005832 0,94279539 Остаток 4 234,4914634 58,62287     Итого 5 234,83                     Коэффициенты         Y-пересечение 223,1210366         Переменная X 1 0,008841463         Рисунок 1- Протокол решения задачи Из рисунка 1 видно, что эмпирические коэффициенты регрессии соответственно равны: b0 = 223 b1 = 0,0088 Тогда уравнение парной линейной регрессии, связывающее величину ежемесячной пенсии y с величиной прожиточного минимума x, имеет вид: ŷ= 223+0,0088х. Далее, в соответствии с заданием необходимо оценить тесноту статистической связи между величиной прожиточного минимума x и величиной ежемесячной пенсии y. Эту оценку можно сделать с помощью коэффициента корреляции ryx. Величина этого коэффициента на рисунке 1 обозначена как множественный R и соответственно равна = 0,038. Поскольку, в общем случае, величина данного коэффициента находится в пределах от -1 до +1, то можно сделать вывод о несущественности статистической связи между величиной прожиточного минимума х и величиной ежемесячной пенсии у. Параметр R – квадрат, представленный на рисунке 1, представляет собой квадрат коэффициента корреляции r2yx и называется коэффициентом детерминации.

Величина данного коэффициента характеризует долю дисперсии зависимой переменной у, объясненную регрессией (объясняющей переменной х). Соответственно величина 1- r2yx характеризует долю дисперсии переменной у, вызванную влиянием всех остальных, неучтенных в эконометрической модели объясняющих переменных.

Из рисунка 1 видно, что доля всех неучтенных в полученной эконометрической модели объясняющих переменных приблизительно составляет: 1-0,00145 = 0,998 или 99,8%. На следующем этапе, в соответствии с заданием, необходимо выполнить количественную оценку влияния объясняющей переменной х на результативную переменную у, используя коэффициент эластичности.

Коэффициент эластичности для модели парной регрессии определяется в виде: Тогда Следовательно, при изменении прожиточного минимума на 1% величина ежемесячной пенсии изменяется на 0,000758%. Далее определяем среднюю ошибку аппроксимации по зависимости: . Для этого исходную таблицу 1 дополняем двумя колонками, в которых определяем значения ŷ, рассчитанные с использованием зависимости и значения разности. Таблица 2 – Расчет средней ошибки аппроксимации № п/п Область Средний размер назначенных ежемесячных пенсий, у.д.е у Прожиточный минимум в среднем на одного пенсионера в месяц, у.д.е х ŷ   1 Орловская 232 166 224 0,032 2 Рязанская 215 199 225 0,045 3 Смоленская 220 180 225 0,021 4 Тверская 222 181 225 0,012 5 Тульская 231 186 225 0,028 6 Ярославская 229 250 225 0,017             Тогда средняя ошибка аппроксимации равна: Из практики известно, что значение средней ошибки аппроксимации не должно превышать (12…15)%. На последнем этапе выполним оценку статистической надежности моделирования с помощью F – критерия Фишера.

Для этого выполним проверку нулевой гипотезы Hо о статистической не значимости, полученного уравнения регрессии по условию: если при заданном уровне значимости теоретическое значение F – критерия Fт больше его критического значения Fкрит, то нулевая гипотеза отвергается, и полученное уравнение регрессии принимается значимым.

Из рисунка 1 следует, что Fт = 0,0058. Критическое значение F – критерия Fкрит, определяем с помощью использования статистической функции FРАСПОБР ( ) табличного процессора MS Exel. Входными параметрами функции является уровень значимости (Вероятность) и число степеней свободы 1 и 2. Для моделей парной регрессии число степеней свободы соответственно равно 1 ( одна объясняющая переменная ) и n-2 = 6-2=4. Критическое значение F – критерия Fкрит =7,71. Так как Fт < Fкрит, то нулевая гипотеза не отвергается и полученное регрессионное уравнение статистически не значимо. 1.2