Парну (просту) лінійну регресію
після перевірки її на адекватність і значущість параметрів і (див. підрозділ 5.7) ми можемо використовувати для прогнозування (розрахунків) залежної змінної у для будь-яких прогнозних значень змінної х. Слід мати на увазі, що рівняння регресії надійно відображає залежність в межах абсолютного розмаху варіації х (). Тому при прогнозних значеннях х, що виходять за ці межі, надійність прогнозу знижується. Отже інтерполяція за регресією незаперечна, а інтерполяція має бути обережною.
Розрізняють два типа прогнозів за рівнянь регресії: точкові й інтервальні.
Точковий прогноз залежної змінної визначають підстановкою у рівняння регресії прогнозного значення фактора :
.
Прогнозне значення є точковою оцінкою дійсного значення , яке, як відомо, дорівнює
,
де - значення неспостережуваної випадкової величини. Оскільки дійсне значення відрізняється від прогнозного, то необхідна побудова інтервального прогнозу – інтервалу довіри для , в якому із заданою ймовірністю буде знаходиться дійсне значення .
Інтервал довіри для математичного сподівання визначається за формулою
, (3.24)
де, як і раніше, - середньоквадратичне відхилення випадкової величини е . Нагадаємо, що
.
Розглянемо умовний приклад. Рівняння регресії має такий вигляд:
;
=22; - 0,75; =8,06; =22,3. Тоді, для прогнозного значення =10 точковий прогноз становить
=5,67+2,72*10=32,87.
Інтервал довіри за формулою (3.24) дорівнює
σ= 0,75.
Отже, дійсне значення з ймовірністю 0,95 має знаходитися в межах
32,87 – 0,35 ≤≤ 32,87+0,35,
або
32,52 ≤≤ 33,22.
Зауважимо, що помилка прогнозу не постійна. Як видно з формули (3.24), в міру збільшення або зменшення прогнозних значень відносно помилка прогнозу зростає. Наприклад, при =15 помилка прогнозу зросте за формулою (3.24) до 1,11. якщо =5, то вона також буде більшою, а саме 0,51. Найменша помилка прогнозу буде для ==8,06, в цьому разі вона дорівнює всього 0,16.
Отже на віддалених ділянках варіації незалежної змінної помилки прогнозу залежної змінної зростають, а довіра до прогнозу зменшується (рис.3.4).
Рис. 3.4 − Границі помилок прогнозу для парної лінійної регресії
Інтервали довіри до прогнозу будуються заздалегідь шляхом варіювання в розумних межах. Це усуває необхідність визначати інтервали довіри в кожному окремому випадку прогнозування залежної змінної.