Кореляційна матриця економічних показників

y x1 x2 x3
y      
x1 0,690433    
x2 0,404724 0,819116  
x3 -0,40934 -0,01483 -0,0979

 

Після аналізу кореляційної матриці можна зробити висновок, що коефіцієнти х1 і х2 мають велике значення коефіцієнту кореляції і це може свідчити про наявність лінійної залежності між ними. На основі даного висновку можна говорити про наявність мультиколінеарності в даній моделі.

2. Визначимо ступінь колінеарності. У разі відсутності мульти­колінеарності у моделі множинний коефіцієнт детермінації R2yx1x2х3 буде приблизно дорівнювати сумі часткових коефіцієнтів детермінації R2yx1, R2yx2, R2yx3. Якщо мультиколенеарність присутня, тоді це рівняння виконуватись не буде і у якості виміру мультиколінеарності можна використати змінну М1:

М1 = R2yx1x2x3 – ( R2yx1 + R2yx2 +R2yx3 ).

Чим більше змінна М1 наближатиметься до нуля, тим менша мультиколінеарність.

Знайдемо коефіцієнти детермінації. Для цього використовуємо надстройку “Аналіз даних– Регресія”.

R2yx1x2x3 = 0,754283 (будуємо регресі ю між y та x1, x2, x3)

R2yx1= 0,476698 (будуємо регресі ю між y та x1)

R2yx2= 0,163801 (будуємо регресі ю між y та x2)

R2yx3= 0,167558 (будуємо регресі ю між y та x3)

M1= 0,754283 – 0,476698 – 0,163801 – 0,167558= – 0,053774

Відповідно, до нашого приклада: М1 ненаближається до 0, тому слід вважати наявність мультиколінеарності.

3. Перевіримо інтенсивність мультиколінеарності за формулою:

Відповідно до нашого приклада отримаємо:

Даний коефіцієнт значно більший нуля, тому можна говорити про високу інтенсивність мультиколінеарності.

4. Одним із методів усунення мультиколінеарності є метод виключення змінних за Фарраром та Глаубером.

Процедура відбору змінних складається з трьох кроків. При цьому передбачається нормальне розподілення залишків.

Крок 1. Мультиколінеарність виявляється в загальному вигляді. Для цього будується матриця R коефіцієнтів парної кореляції між пояснюючими змінними та визначається її визначник.

rij=cov(xi, xj)/σxi σxj

Кореляційну матрицю можна отримати використовуючи пакет “Аналіз даних” електронної таблиці Excel інструмент “Кореляція”.

0,321622

Далі для перевірки наявності мульколінеарності взагалі серед пояснюючих змінних використовується хі квадрат критерій χ2 (хі квадрат ).

Висувається нульова гіпотеза Н0: між пояснюючими змінними мультиколінеарність відсутня. Альтернативна гіпотеза Н1:між пояснюючими змінними є мультиколінеарність.

Розраховують значення χ2

χ2=–(n-1-1/6*(2*m+5))*lnD

де n–кількість спостережень, m– кількість пояснюючих змінних.

Ця величина має розподіл χ2 з f=1/2*m*(m-1) ступенями вільності. Якщо розраховане значення χ2 менше за табличне, то Н0 приймається. вважаємо, що мультиколінеарності між пояснюючими змінними немає. Інакше . А які данні сильно корелюють визначається на другому кроці.

χ2= – (10-1-1/6*(2*2+5))*ln(0,321622)=8,508,

f=1/2*2*(2-1)=1.

Табличне значення χ2=3,841 (при f=1 та α=0,05)

Таким чином (8,508 ≥ 3,841), тому гіпотеза про наявність мультиколінеарності між пояснюючими змінним не суперечить даним дослідження

Крок 2. Використовуються коефіцієнти детермінації між пояснюючими змінними R2k12…k-1k+1…m. Оцінка мультиколінеарності основана на тому, що величина

має F-розподіл з f1=m-1 I f2=n-m ступенями вільності.

Якщо F≥Fα;f1,f2, то змінній xk в найбільшому ступені притаманна мультиколінеарність. По Фаррару і Глауберу вивчення m значень F-статистик має показувати, які з пояснюючих змінних в більшій мірі підверджені мультиколінеарності.

R2 x1,x2,x3 = 0,675265

F = (10-2)*0,675265/[(2-1)*(1–0,675265)]= 16,6355

F ≥ Fтабл.

R2 x2,x1,x3= 0,678307

F = (10-2)*0,678307/((2-1)*(1-0,678307))= 16,8684

F ≥ Fтабл.

R2 x3,x1,x2= 0,02257

F = (10-2)*0,02257/((2-1)*(1–0,02257))=5,367608/0,329049=0,18473

F < Fтабл.

Fтабл .= 5,32 з f1 = m-1 = 2-1 = 1 I f2 = n-m = 10-2=8 ступенями вільності.

F ≥ Fтабл.

Таким чином змінним х1 та х2 в найбільшому ступені притаманна мультиколінеарність

Крок 3. З’ясовується, яка пояснююча змінна породжує мультиколінеарність, та вирішується питання про її виключення з аналізу. Для цієї цілі розраховується коефіцієнт частинної кореляції rjk12…m (j, k=1,2,…,m; j <> k) між пояснюючими змінними. Змінна y в розрахунок не береться. В якості критерію використовується величина

що має t-розподіл з f = n – m ступенями вільності. Якщо tj,k > tα,f, то між змінними існує колінеарність и одна з них має бути виключеною. При виключенні змінної дослідник має опиратися як на власну інтуїцію, та і на змістовну теорію явища. Якщо tj,k ≤ tα,f, то дані не підтверджують наявність колінеарності між змінними xj та xk .

Знайдемо коефіцієнти частинної кореляції rjk12…m (j, k=1,2,…,m; j<>k) між пояснюючими змінними. Кореляційна матриця має вигляд.

x1 x2 x3
x1    
x2 0,819116  
x3 -0,01483 -0,0979

t0.05;8 = 2,31

r2 123 = r2 12+r213,

r2 231 = r2 23+r2 21

r2 312 = r2 31+r232

1. r2 123

r2 123 = 0,8191162+(–0,01483)2 = 0,671171, r 123 = 0,819225

4.040761

t12 > t0.05;8 Між змінними х1 та х2 існує колінеарність.

2. r2 213

r2 231 = (–0,0979)2 + 0,8191162 = 0,68053, r 213 = 0,824946

4.12815

t23 > t0.05;8 . Між змінними х2 та х3 існує колінеарність.

3. r2 312

r2 312 = (–0,01483)2+(–0,0979)2 = 0,009804 = 0,099017

0,281445

t31 < t0.05;8. Між змінними х3 та х1 не існує колінеарність.

Висновок: змінну х2 потрібно вилучити з розгляду. Наша модель буде показувати залежність між y (прибутку підприємства, тис.грн.) та х1 (виробничих витрат, тис.грн.) та х3 (середньої кількості працівників, чол.).

Економетрична модель буде мати вигляд:

y = 9,976384 + 0,349471*x1 – 0,03592*x2

 

Контрольні питання:

1. Поняття мультиколінеарності.

2. Причини виникнення мультиколінеарності.

3. Тестування наявності мультиколінеарності.

4. Методи усунення мультиколінеарності.

 

 

Лабораторна робота № 7

(4 години)