Множинна регресія.

Економічні явища залежать від великої кількості факторів. Тому на практиці часто використовують рівняння множинної|факторів| регресії, коли на величину результативної ознаки впливають два і більш фактори.

Одна з умов кореляційного аналізу - однорідність досліджуваної інформації. Критерієм однорідності інформації служать коефіцієнти варіації, які розраховуються по кожному факторному й результативному показнику.

Коефіцієнт варіації показує відносну міру відхилення окремих значень від середньоарифметичної. Він розраховується по формулі

 

 

Чим більше коефіцієнт варіації, тим відносно більший розкид об'єктів, що вивчаються.

Мінливість варіаційного ряду|низки| прийнято вважати за незначну, якщо варіація не перевищує 10%, середньою - якщо складає 10-12%, значною - якщо вона більше 20%, але|та| не перевищує 33%. Якщо вона вище 33%, то це говорить про неоднорідність інформації і необхідності відкинути нетипові спостереження.

На підставі найвищого показника варіації можна визначити необхідний обсяг вибірки даних для кореляційного аналізу по наступній|такій| формулі

 

 

де n - необхідний обсяг вибірки даних;

V - варіація %;

t - показник надійності зв'язку (відповідний довірчій вірогідності|ймовірності|);

m - показник точності розрахунків % (для економічних розрахунків допускається помилка 5-8%).

Після|потім| відбору факторів і оцінки початкової|вихідної| інформації важливим|поважним| завданням|задачею| є|з'являється| моделювання зв'язку між факторним|факторами| і результативним показником. На практиці найчастіше використовують багатофакторні лінійні моделі |факторів| і моделі, які приводяться|наводять| до лінійного вигляду|виду| відповідними перетвореннями, тобто|цебто|

 

або

 

та інші.

 

У разі, коли важко обгрунтувати форму залежності, рішення задачі можна провести по різних моделях і порівняти отримані результати. Адекватність різних моделей фактичним залежностям перевіряється по критерію Фішера, величині коефіцієнта множинної|численної| кореляції і детермінації.

Рішення задачі багатофакторного кореляційного аналізу |фазазвичай|звично| проводиться на ЕОМ по типових програмах. Початкові|вихідні| дані вводяться|запроваджують| в ЕОМ, яка розраховує матриці парних і приватних коефіцієнтів кореляції, рівняння множинної|численної| регресії, а також показники, за допомогою яких оцінюється надійність коефіцієнтів кореляції і рівняння зв'язку.

Коефіцієнти парної кореляції характеризують тісноту зв'язку між показниками з врахуванням взаємозв'язків факторів, що впливають на результативний показник.

Приватний коефіцієнт кореляції виражає тісноту зв'язку між двома ознаками при усуненні змін, викликаних впливом інших ознак. Для їх обчислення проводяться досить трудомісткі розрахунки.

Якщо приватний коефіцієнт кореляції, що характеризує взаємозв'язок факторів між собою, вище 0,85, то один з факторів необхідно виключити з моделі. Наявність лінійного зв'язку між двома факторами називають коллінеарністю, а між декількома чинниками - мультіколлінеарністю.

Величина коефіцієнтів кореляції є випадковою, залежною від обсягу вибірки. Значущість коефіцієнтів кореляції (зазвичай приватних ) перевіряється по критерію Стьюдента:

де - середня квадратична| помилка коефіцієнта кореляції, яка визначається по формулі

Якщо розрахункове значення t вище табличного, то можна зробити висновок|виведення| про значущість коефіцієнта кореляції. Табличні значення t знаходять|находять| по таблиці значень критеріїв Стьюдента. При цьому враховуються кількість мір свободи (V = n - 1) і рівень довірчої вірогідності|ймовірності| (0,05 або 0,01).

 

Розрахунок рівняння регресії проводиться зазвичай кроковим способом. Спочатку враховується один фактор, який робить найбільш значущий вплив на результативний показник, потім другий, третій і далі послідовно. І на кожному кроці розраховуються рівняння зв'язку, множинний коефіцієнт кореляції і детермінації, критерій Фішера й інші показники, що оцінюють надійність рівняння. Величина їх на кожному кроці порівнюється з попередньою. Якщо додавання наступних факторів не покращує оцінних показників зв'язку, то треба їх відкинути.

Розглянемо, яким чином відбувається розрахунок багатофакторного лінійного рівняння|фактору|.

Параметр рівняння називають приватним коефіцієнтом регресії. Він показує, як в середньому змінюється результативна ознака уіз зміною факторної ознаки на одиницю за умови, що інші факторні ознаки залишаються незмінними.

Для визначення параметрів , ... необхідно скласти і вирішити систему нормальних рівнянь

 

 

При двох факторах лінійне рівняння регресії має наступний вигляд

 

 

У цьому випадку система рівнянь набере вигляду

 

 

 

Приватні коефіцієнти регресії у багатофакторній моделі при відповідній змінній зазвичай відрізняються від коефіцієнтів при цієї змінній у парній моделі. Причина розбіжностей|розходжень| приватних і парних коефіцієнтів регресії полягає у взаємозв'язку факторних ознак |факторів| і .

Тісноту зв'язку між результативною ознакою і сукупністю факторних ознак |факторів| визначають за допомогою сукупного коефіцієнта детермінації

 

де - теоретична дисперсія багатофакторного рівняння регресії.

Сукупний коефіцієнт детермінації характеризує частку варіації результативної ознаки, яка лінійно пов'язана з варіацією включених в рівняння регресії факторних ознак.

 

Теоретичну дисперсію обчислюють за формулою

 

Перевірку значущості зв'язку здійснюють за допомогою F-критерію| і коефіцієнта детермінації. При цьому

= m - 1;

= n - m.

Якщо фактичне значення перевищує критичне, то істотність|суттєвість| зв'язку результативної ознаки з|із| обома факторами доведена.

Як вже було вказано вище, коефіцієнти рівняння регресії показують кількісну дію кожного фактору на результативний показник при незмінності інших. Проте, вони мають різні одиниці виміру, що робить їх незіставними, якщо виникає питання про порівняльну силу дії факторів на результативний показник. Щоб привести їх в зіставний вигляд, розраховують стандартизованные коефіцієнти регресії або бетта-коефіцієнти.

Бетта-коефіцієнти й коефіцієнти регресії зв'язані наступним чином|слідуючими|:

 

 

Тобто змінні рівняння регресії виражаються в долях середньо квадратичного відхилення. Бетта-коефіцієнти показують, що якщо величина фактору збільшиться на одне середнє квадратичне відхилення, то відповідна залежна змінна збільшиться або зменшиться на долю свого середньо квадратичного відхилення.

Зіставлення бетта-коефіцієнтів дозволяє зробити висновок|виведення| про порівняльну міру дії кожного фактору на величину результативного показника.

Аналогічно|за аналогією| можна зіставити й коефіцієнти еластичності, які розраховуються по формулі:

 

 

5. Рангова кореляція

Взаємозв’язок між ознаками, які можна зранжувати, передусім на основі бальних оцінок, вимірюється методами рангової кореляції. Рангами називають числа натурального ряду, які згідно зі значеннями ознаки надаються елементам сукупності і певним чином упорядковують її. Ранжування проводиться за кожною ознакою окремо: перший ранг надається найменшому значенню ознаки, останній — найбільшому або навпаки. Кількість рангів дорівнює обсягу сукупності. Рангові оцінки щільності зв’язку доцільно використовувати для сукупностей невеликого обсягу.

Ранги, надані елементам сукупності за ознаками х і у, позначають відповідно Rxj та Ryj. Залежно від ступеня зв’язку між ознаками певним чином співвідносяться й ранги. При прямому функціональному зв’язку Rxj = Ryj, тобто відхилення між рангами dj = Rxj – Ryj = 0, отже, і сума квадратів відхилень .

На відхиленнях між рангами базується розрахунок коефіцієнту рангової кореляції, який використовують при вимірі|вимірюванні| зв'язку між ознаками порядкової шкали. Його обчислюють за формулою Спірмена

 

 

де n - число елементів сукупності.

 

Цей коефіцієнт має такі самі властивості, як і лінійний коефіцієнт кореляції: змінюється в межах від – 1 до + 1, водночас оцінює щільність зв’язку та вказує на його напрям.

Для прикладу|зразка| використаємо дані таблиці 8.7, в якій приведені ранги 10 ділянок підприємства відповідно|відповідно до| їх місцю по кількості порушень вимог правил безпеки (ПБ) й кількості випадків травматизму.

Підставивши дані у формулу коефіцієнта Спірмена, отримаємо|одержуватимемо|

 

 

Це свідчить про високий прямий зв'язок між порушеннями вимог ПБ й рівнем травматизму.

 

Таблиця 8.7 - Розрахунок коефіцієнта рангової кореляції

Ділянка підприємства Ранги
Порушення вимог ПБ Травматизм
+2 -1 -1 +1 -1 -1 +1
Разом х

 

Перевіримо істотність зв'язку. Критичне значення коефіцієнта рангової кореляції для рівня значущості =0,05 й n=10| складає (10)=0,56 (див. табл. 8.8). Фактичне значення більше критичного, тобто|цебто| наявність зв'язку між ознаками доведена. Відмітимо|помітимо|, що для зворотних зв'язків з|із| критичним порівнюється абсолютна величина фактичного значення .

Рангові коефіцієнти мають як переваги, так й недоліки|нестачі| порівняно з|порівняно із| параметричними. Тут не потрібно дотримувати певних математичних передумов щодо|відносно| розподілу ознак, зокрема, умови нормальності розподілу. Проте|однак|, оскільки використовуються не значення, а лише ранги ознак, втрачається певна інформація про взаємозв'язки.