Алгоритм Феррара — Глобера.

В алгоритмі Феррара — Глобера використовують три види статистичних критеріїв, на їхній підставі перевіряють мультиколінеарність:— критерій , за допомогою якого перевіряють мультиколінеарність усього масиву факторних ознак;— F-критерій, за його допомогою перевіряють гіпотезу Н₀: коефіцієнт детермінації дорівнює нулю: та гіпотезу H₁:коефіцієнт детермінації не дорівнює нулю: . За допомогою F-тесту перевіряють кореляцію кожної факторної ознаки з усіма іншими;— Т-критерій, на підставі якого перевіряють гіпотезу Н₀: частковий коефіцієнт кореляції дорівнює нулю: та гіпотезу Н₁: частковий коефіцієнт кореляції не дорівнює нулю: де — часткові коефіцієнти кореляції, які характеризують тісноту зв'язку між факторними ознаками х_lта х_jза умови, що решта факторних ознак не впливає на цей зв'язок.За допомогою t-тесту перевіряють наявність лінійної кореляційної залежності кожної пари факторних ознак. Порівняння розрахованих значень цих критеріїв з їхніми критичними значеннями дає можливість зробити висновки щодо наявності чи відсутності мультиколінеарності.

Алгоритм Феррара — Глобера складається з кількох кроків.Крок 1.Нормалізація факторних ознак x₁,x₂,..x_k, яку здійснюють за допомогою перетворення , (7.78) де п — величина вибірки для кожної змінної (i=1,n); k-кількість факторних ознак у моделі (j=1,k); — середнє значення j-ї факторної ознаки; — дисперсіяj-ї факторної ознаки.

Для нормалізованих значень факторних ознак виконуються умови: Крок 2.Обчислення кореляційної матриці де X* — матриця нормалізованих значень факторних ознак.

Елементами матриці Rє парні коефіцієнти кореляції, які характеризують тісноту зв'язку між l-юта j-ю факторними ознаками. Однак на підставі знайденої кореляційної матриці В не можна стверджувати, що отриманий зв'язок є явищем мультиколінеарності.Крок 3. Обчислення значення -критерію — , де — визначник кореляційної матриці R. Знаходимо табличне значення при — ступенях вільності і рівні значущості α. Якщо , тоімовірністю р=1-α можна стверджувати, що в масиві факторних ознак є мультиколінеарність. Якщо , то з імовірністю р=1-α можемо зробити висновок щодо відсутності мультиколінеарності.Крок 4. Визначення матриці помилок С=.Крок 5.Розрахунок значень F-критерію — де -діагональні елементи матриці С. При заданих ступенях вільності n-k і k-1 та рівні значущості α знаходимо табличне значення критерію і порівнюємо розраховані значення з табличним .Якщо > , то з імовірністю р=1-α гіпотезу Н₀ відкидаємо, а це означає, що j-та факторна ознака колінеарна з усіма іншими і потрібно вирішити питання про її вилучення з переліку змінних моделі. Якщо , то з імовірністю р=1-α гіпотезу Н₀ приймаємо, тобто факторна ознака х_j не є колінеарною з усіма іншими. На підставі діагональних елементів матриці С можна розрахувати коефіцієнти детермінації для кожної факторної ознаки: .Коефіцієнт детермінації характеризує вплив усіх інших факторних ознак на факторну змінну х_j.Крок 6. Обчислення часткових коефіцієнтів кореляції, які характеризують тісноту зв'язку між двома факторними ознаками за умови, що всі інші факторні ознаки не впливають на цей зв'язок (тестування наявності парної колі-неарності) —

де — елемент матриці С, який розміщений на перетині l-їстрічки та j-го стовпця; діагональні елементи матриці С.

Якщо порівняти деякі кількісні значення часткових і парних коефіцієнтів кореляції, то можна побачити, що перші значно менші від других. Отже, на підставі лише часткових коефіцієнтів кореляції висновок про парну коліне-арність зробити неможливо. Для цього потрібно виконати ще сьомий крок.

Крок 7.Розрахунок значень t-критерію — Розраховані значення критерію порівнюємо з табличним значенням при n-kступенях вільності і рівні значущості α. Якщо то з імовірністю р=1-α гіпотезу Н₀відкидаємо, тобто між факторними ознаками x_lі х_j наявна колінеарність. Якщо то з імовірністю р=1-α гіпотезу Н₀приймаємо, тобто факторні ознаки х_l і х_j неколінеарні.

Аналізуючи значення критеріїв Fі t,можна зробити висновок, яку з факторних ознак потрібно вилучити з розгляду у побудованій кореляційно-регресійній моделі, це варто робити з огляду на економічні та логіко-теоретичні міркування. Якщо за допомогою алгоритму Феррара — Глобера не можна визначити, яку факторну ознаку потрібно вилучити з переліку змінних моделі, то оцінювати параметри моделі методом найменших квадратів не варто. У такому разі використовують інші методи, наприклад, метод головних компонент або одну з його модифікацій.

44. Узагальнений метод найменших квадратів (матричний підхід)

На відміну від звичайного методу найменших квадратів, узагальнений метод найменших квадратів ураховує інформацію про неоднаковість дисперсії і тому дає можливість одержати найкращі лінійні оцінки.

Розглянемо узагальнену множинну лінійну кореляційно-регресійну модель, зображену в матричному вигляді:

цеY - це n-вимірна матриця-стовпець спостережень за результуючою змінною у; X - матриця спостережень розмірності п*(k + 1) за факторними ознаками х₁,...,х_k, у якій елементами першого стовпця є одиниці для одержання вільного члена моделі, а інші стовпці є векторами спостережень за факторними ознаками х₁,...,х_k; β – (k+1) - вимірна матриця-стовпець невідомих параметрів моделі; ε – n-вимірна матриця-стовпець випадкових величин ε_і.

Вибіркова кореляційно-регресійна модель має вигляд:

де Ỹ- n-вимірна матриця-стовпець теоретичних значень результуючої змінної, що розраховані на підставі кореляційно-регресійної моделі; b – (k+1) – вимірна матриця-стовпець оцінок параметрів кореляційно-регресійної моделі.

Позначимо через е = Y-Ỹ вектор випадкових відхилень.

Завдання полягає у знаходженні оцінок елементів вектора β у моделі. Для цього використовують матрицю S, за допомогою якої коригують вхідну інформацію.

Оскільки S — додатно визначена матриця, то вона може бути представлена як добуток РР^Т, де матриця Р є ненародженою, тобто S = РР^Т.

При заданій матриці S оцінки параметрів моделі можна обчислити за формулою

стандартну похибку — згідно . Отже, ми можемо побудуватидовірчі інтервалитакритерії перевіряння статистичної значущості параметрів регресії β.

Дисперсія трансформованої похибки ε є постійною величиною, тобто для моделі

P^-1Y=P^-1Xβ+P^-1ε виконується припущення про гомоскедастичність і оцінювання її параметрів можна проводити на підставі методу найменших квадратів.