Таблиця 8.6 – До розрахунку параметрів лінійної регресії

Номер підприємства Обсяг виробництва, млн. од., х, Валові витрати у, млн.грош.од. ху х2
1,1 25,3 1,21
1,4 35,0 1,96
1,2 31,2 1,44
2,0 66,0 4,00
1,5 40,5 2,25
1,3 2,8 36,4 1,69
1,8 54,0 3,24
1,7 54,4 2,89
Разом 12,0 342,8 18,68

 

= 12; = 224; = 342,8; = 18,68;

Тобто необхідно рішити систему рівнянь:

 

224 = 8b0 + 12b1

342,8 = 12b0 + 18,68 b1

 

Рівняння регресії має вигляд

,

тобто кожна одиниця зростання обсягу виробництва дає приріст валових витрат в середньому 10 млн. грош. од. Якщо обсяг виробництва нульовий (х = 0), то підприємство несе постійні витрати в суммі 13,0 млн. грош. од.

Рівняння регресії відбиває закон зв’язку між х і у не для окремих елементів сукупності, а для сукупності в цілому; закон, який абстрагує вплив інших факторів, виходить з принципу «за інших однакових умов».

 

На 3-му етапі відбувається визначення щільності зв'язку. Воно, як і в методі аналітичних угрупувань, засновано на правилі складання дисперсій.

Але, так як в регресійному аналізі оцінками лінії регресії є її теоретичні значення, то відхилення індивідуальних значень ознаки у від загальної середньої можна подати як наступні дві складові:

- відхилення від лінії регресії (у – Y);

- відхилення лінії регресії від середньої .

Відхилення є наслідком дії фактора х, відхилення — наслідком дії інших факторів.

Взаємозв’язок факторної та залишкової дисперсій описується правилом:

 

,

де — загальна дисперсія ознаки y;

- факторна дисперсія;

σ - залишкова дисперсія

 

де Y, у|в| - відповідно теоретичні та фактичні значення результативної ознаки.

Значення факторної дисперсії буде тим більшим, чим сильніший вплив фактора х на y. Відношення факторної дисперсії до загальної розглядається як міра щільності кореляційного зв’язку і називається коефіцієнтом детермінації (аналогічний кореляційному відношенню):

.

Даний показник є|з'являється| універсальним. Його можна застосовувати при будь-якій формі залежності (лінійній або нелінійній).

Приведені формули факторної та залишкової дисперсій вимагають попереднього визначення (розрахунку) теоретичних значень Y для всіх елементів сукупності.

Щоб|аби| зменшити обсяг|об'єм| обчислень|підрахунків|, на практиці використовують іншу розрахункову формулу факторної дисперсії (для лінійної регресії)

 

Для параболічної регресії другого порядку факторна дисперсія визначається за формулою

 

 

Коефіцієнт детермінації, як і кореляційне відношення|ставлення|, набуває значень від 0 до 1. Він характеризує ступінь|міра| близькості кореляційного зв'язку до суворо функціонального. При =0 кореляційний зв'язок між у|в| та х відсутній. При =1 зв'язок між ознаками є|з'являється| функціональним (оскільки|тому що| залишкова дисперсія дорівнює нулю).

Корінь квадратний з|із| коефіцієнта детерміації називають індексом кореляції. Він також змінюється в межах від 0 до 1 й характеризує тісноту зв'язку, проте|однак| економічної інтерпретації не має.

R = .

 

Індекс кореляції збігається з абсолютною величиною коефіцієнта кореляції Пірсона. Позначається цей коефіцієнт символом r. Оскільки сфера його використання обмежується лінійною залежністю, то і в назві фігурує слово «лінійний». Обчислення лінійного коефіцієнта кореляції r ґрунтується
на відхиленнях значень взаємозв’язаних ознак x і у від середніх.

 

Значення r коливаються|вагаються| від -1 до 1 й характеризують не лише|не тільки| тісноту, але й напрям|направлення| зв'язку. Позитивне значення r означає прямий зв'язок між ознаками, а негативне|заперечне| - зворотній. Прийнято вважати|лічити|, що при ½r½=0 зв'язок відсутній, при ½r½<0,3 – зв'язок слабкий|слабий|, 0,3£½r½£0,7 -| середній, ½r½>0,7 – сильний, ½r½=1 – функційний. На практиці застосовують різні модифікації наведеної формули коефіцієнта кореляції. Наприклад,

де - коваріація| х по у|в|.

 

Тому часто зустрічається запис

 

Параметри лінійного рівняння регресії можуть бути також визначені за допомогою рівняння (отриманого|одержувати| на основі використання методу найменших квадратів)

де - відповідно середнє значення у|в| й х за фактичними даними (даними вибірки)

- коефіцієнт кореляції у|в| по х

- коефіцієнт рівняння регресії.

4-й етап. Перевірку істотності зв'язку в регресійному аналізі здійснюють за допомогою тих же критеріїв й по тих же процедурах, що і в аналітичних угрупуваннях. Ступені свободи залежать від числа параметрів рівняння регресії

= m - 1; = n - m

 

де n, m - відповідно кількість спостережень (обсяг|об'єм| вибірки) й кількість параметрів в рівнянні зв'язку, враховуючи вільний член рівняння.

|цебто|Для лінійної моделі = 2 -1 = 1.

Значущість зв'язку можна перевірити за допомогою таблиць критичних значень коефіцієнта детермінації . Якщо фактичне значення перевищує критичне, це свідчить про істотність зв'язку між факторною та результативною ознаками.

У випадку, якщо|в разі , якщо| використовується F-критерій|, його фактичне значення визначають за формулою

 

 

У невеликих сукупностях коефіцієнт регресії схильний до випадкових коливань, тому слід визначати довірчий інтервал коефіцієнта регресії. Середня помилка коефіцієнта регресії визначається за формулою

де - варіація факторної ознаки,

- залишкова дисперсія,

- число ступенів свободи,

m — кількість параметрів рівняння регресії (для лінійної функції m = 2)

 

Величина граничної помилки залежить від довірчої ймовірності (, де t - коефіцієнт довіри|довір'я|.)

Перевірити слід й його істотність. Коли зв’язок лінійний, істотність коефіцієнта регресії перевіряють за допомогою t-критерію (Стьюдента), статистична характеристика якого визначається відношенням коефіцієнта регресії b до власної стандартної похибки тобто . Якщо розраховане значення перевищує критичне для двостороннього t-критерію, то гіпотеза про випадковий характер коефіцієнта регресії відхиляється, а отже, з визначеною імовірністю вплив факторної ознака на результативну визнається істотним.

 

Важливою характеристикою регресійної моделі є відносний ефект впливу фактора х на результат у коефіцієнт еластичності:

.

Він показує, на скільки процентів у середньому змінюється результат у зі зміною фактора х на 1%.