Напрями побудови лінійної моделі множинної регресії

Для побудови лінійної моделі множинної регресії використовується статистична інформація про діяльність підприємства і здійснюються такі етапи: математико-статистичний аналіз, побудова багатофакторної регресійної моделі, перевірка побудованої моделі на адекватність, аналіз (інтерпретація) отриманих результатів.

На етапі математико-статистичного аналізу проводиться перевірка основних припущень класичного регресійного аналізу, крім того, здійснюється найважливіша процедура багатофакторного аналізу – перевірка факторів на мультиколінеарність. Слід відзначити, що термін “мультиколінеарність” означає, що в багатофакторній регресійній моделі дві або більше незалежних змінних (факторів) пов’язані між собою лінійною залежністю або, іншими словами, мають високий ступінь кореляції (r_xixj ® 1, i ¹ j).

Для здійснення математико-статистичного аналізу будується матриця коефіцієнтів парної кореляції, який показує ступінь зв’язку між факторами економетричної моделі. Потім аналізуються коефіцієнти парної кореляції між факторами. Результатом етапу математико-статистичного аналізу є знаходження множини основних незалежних між собою факторів, що є базою для побудови регресійної моделі.

На другому етапі для побудови багатофакторної моделі вибираються фактори, що будуть відображати причинно-наслідковий зв’язок. В цьому аспекті широке використання отримали «покроковий» метод і метод “виключень”.

Найбільш доцільно відшукувати рівняння множинної регресії шляхом послідовного підключення до парного рівняння решти аргументів в порядку їх значущості («покроковий метод»). У цьому випадку виявляється можливість на кожному етапі аналізувати:

- обумовленість вирішуваної системи за чисельним значенням її визначника (детермінатора);

- зміна β- коефіцієнтів, чисельне значення яких має бути менше 1, а знак не суперечити логіці;

- зростання коефіцієнта множинної кореляції R і убування залишкової дисперсії .

Методика послідовного підключення аргументів складається з наступних операцій.

1.Обирається аргумент х₁, якому відповідає найбільший за абсолютним значенням "зовнішній коефіцієнт" кореляції

| r _y1| = max | r _yi|, j = 1,2….q. (10.3)

За аргументом х₁ записується рівняння

t_y1 = t_y1t_x1. (10.4)

2.Приєднюється аргумент х_io, для якого

| r _xj X₁ | = min | r _xj _x1 |, j = 2,3,… q. (10.5)

Складається система нормальних рівнянь

r _yх1= β₁+ r _хjoβ₂; (10.6)

r _{y xjo}= β₁ r _{хjo x1}+ β₂ (10.7)

і обчислюються значення β₁и β₂. Визначаються

R²_{y, x1 хjo} = β₁ r_yx1 + β₂r _{y xjo}; (10.8)

σ_у, _{х1 xjo}= (10.9)

Порівнюється R²_{y, x1 хjo}, σ_у, _{х1 xjo}відповідно з r²_yx1,σ_{у х1}.

Переконуються в справедливості нерівності

R²_{y, x1 хjo}≥ r²_yx1; σ_у, _xjo≤ σ_{у х1}. (10.10)

У противному разі замінюється чинник аргумент іншим х_j1_,а аргумент X_j0 переноситься на останнє місце.

3.Далі приєднується наступний аргумент X_j1 і розв'язується система з трьома невідомими:

r _{y х1}= β₁+ β₂r_{х1 xjo} + β₃r_{х1 xj1}; (10.11)

r _{y xjo} = β₁r_{х1 xjo}+ β₂+ β₃r_{xjo xj1}; (10.12)

r _{y xj1} = β₁r_{х1 xjo}+ β₂r_{xjo xj1}+ β₃. (10.13)

Обчислюються значення β_1, β₂и β₃. Визначаються

R²_{y, x1 хjo xj1}= β₁ r _{y х1} + β₂r _{y xjo}+ β₃r _{y xj1}; (10.14)

σ_у, _{xjo xj1}= σу . (10.15)

і порівнюються з R²_{y, x1 хjo}і σ_у, _{x1 хjo}. Переконуються в справедливості нерівності

R²_{y, x1 хjo xj1}≥ R²_{y, x1 хjo}; (10.16)

σ_у, _{x1 хjo xj1}≤ σ_у, _{x1 хjo}. (10.17)

У противному разі поступають аналогічно П.2.

Дослідження ведуть до тих пір, поки не будуть апробовані чинники-аргументи і збережені тільки ті з них, для яких β_j–коефіцієнти суттєві й лінійно незалежні. У результаті виходить множинне рівняння в стандартизованому масштабі.

Від рівняння множинної регресії в стандартизованому масштабі

t _xi = β₁t₁ + β₂t₂ + ….+ β_pt_n (10.18)

до рівняння множинної регресії в натуральному масштабі

_{х1, х2…Хр} = а₁х₁ + а₂х₂ + ….+ а_рх_р+b. (10.19)

Перехід здійснюється подвійно.

1.Шляхом використання формул

(10.20)

При цьому маємо

(10.21)

Підставивши відомі значення , σ_xi, σ_у, β_i і _I, отримаємо рівняння множинної регресії в натуральному масштабі, в якому чисельне значення вільного члена додатково визначати не потрібно.

2.Невідомі коефіцієнти а_i в рівнянні множинної регресії в натуральному масштабі визначають з виразу

. (10.22)

Чисельне значення вільного члена

b = -(а₁₁+ а₂₂ + …+ а_рр). (10.23)

Метод “виключень” складається в тому, що вибирається набор факторів, які ймовірно можуть впливати на результативний показник. Потім, почерзі виключаються ті фактори, у який найменший коефіцієнт кореляції (згідно матриці статистики), а значення часткових F-критеріїв неперевищуюють нормативні значення. Таким чином, залишаться лише ті змінні, які відповідають розглянутим вище умовам.

Слід вказати, що на цьому етапі розраховується коефіцієнт множинної кореляції, який показує загальний вплив незалежних факторів на результуючий показник економетричної моделі. Він знаходиться у проміжку між 0 і 1. Чим більше вплив факторів, тим коефіцієнт множинної кореляції наближається до 1. Він не може перевищувати значення останньої.

Розрахунок коефіцієнта множинної кореляції () розраховується за формулою Боярського [18]:

, (10.24)

де – порядок повної матриці коефіцієнтів кореляції;

– визначник повної матриці коефіцієнтів кореляції із заміною нижнього правого елемента нулем;

- визначник матриці, в якій враховані коефіцієнти парної кореляції незалежних факторів.

Якщо розкрити визначники для двохфакторної економетричної моделі, то коефіцієнт множинної кореляції може бути визначений:

, (10.25)

де , - коефіцієнти парної кореляції між залежною змінною у і незалежними факторами х₁, х₂;

- коефіцієнт парної кореляції між незалежними змінним х₁, х₂_.

З метою контролю правильності розрахунків цей коефіцієнт визначають також за формулою [18]:

. (10.26)

де - -коефіцієнти для незалежних факторів економетричної моделі. Цей коефіцієнт може бути розрахований наступним чином [18]:

, (10.27)

де – визначник (детермінант) матриці взаємної кореляції (мультиколінеарності) із заміною в ній і-го стовпця стовпцем коефіцієнтів кореляції . Наприклад, -коефіцієнти для одного з факторів двохфакторної моделі разраховуються наступним чином:

. (10.28)

Знайдені в результаті рішення кореляційної матриці β-коефіцієнти показують на яку частину середньоквадратичного відхилення σ_у змінюється середнє значення функції, якщо відповідний аргумент зменшується або збільшується, а інші аргументи залишаються незмінними.

Для з'ясування математико-статистичного змісту множинної кореляції всю досліджувану групу змінних слід розглядати як один чинник-аргумент. При цьому розраховується коефіцієнт надійності

М = . (10.29)

Стандартну помилку (середню квадратичну похибку) коефіцієнта множинної кореляції визначають за формулою

σ_R = (1-R)/, (10.30)

де n-обсяг вибірки.

Сукупний вплив врахованих змінних на функцію визначається коефіцієнтом загальної детермінації R², а окремих чинників-аргументів за чисельними значеннями приватної детермінації r_iβ_i:

R² = r₁β₁+ r₂β₂+…..+ r_pβ_p. (10.31)

Стандартну (систематичну) похибку ²обчислюють за формулою

²= 1-(1- R²) , (10.32)

де Р - число параметрів рівняння регресії. З рівняння множинної регресії можна отримати рівняння чистої (приватної) регресії по кожному з аргументу х_i. Для цього фіксується значення всіх аргументів, окрім х_i, на середньому рівні.

Отримане рівняння описує, як в середньому змінюється із зміною х_i, якщо всі інші аргументи постійні й закріплені саме на своїх середніх рівнях.

Приклад. Розрахуйте коефіцієнт множинної кореляції та визначте -коефіцієнти, на основі даних представлених в табл. 10.1.

Таблиця 10.1. Матриця статистики економічних показників

Показники	Коефіцієнти парної кореляції
Р (у) (рентабельність продукції)	ФЗоз (х₁) (фондоозброєність основних засобів)	Ч (х₂) (середньоспискова чисельність працівників)
Р (у) (рентабельність продукції)		0,87	0,65
ФЗоз (х₁) (фондоозброєність основних засобів)	0,87		0,36
Ч (х₂) (середньоспискова чисельність працівників)	0,65	0,36

Вирішення

1. Визначимо -коефіцієнти для факторів х₁ і х₂ (формула 10.28):

= 0,731

= 0,387

2. Розрахуємо коефіцієнт множинної кореляції (формула 10.26):

0,945

На наступному етапі аналізу перевіряється адекватність моделі за допомогою використанням F-критерію Фішера і t-критерію Ст’юдента. При перевірці на адекватність економетричної моделі також використовується тест Дарбіна-Уотсона, який спрямований для перевірки кореляції між залишками.

На останньому етапі отримана модель аналізується і інтерпретується.