Алгоритм Феррара — Глобера.

В алгоритмі Феррара — Глобера використовують три види статистичних критеріїв, на їхній підставі перевіряють мультиколінеарність:— критерій , за допомогою якого перевіряють мультиколінеарність усього масиву факторних ознак;— F-критерій, за його допомогою перевіряють гіпотезу Н0: коефіцієнт детермінації дорівнює нулю: та гіпотезу H1:коефіцієнт детермінації не дорівнює нулю: . За допомогою F-тесту перевіряють кореляцію кожної факторної ознаки з усіма іншими;— Т-критерій, на підставі якого перевіряють гіпотезу Н0: частковий коефіцієнт кореляції дорівнює нулю: та гіпотезу Н1: частковий коефіцієнт кореляції не дорівнює нулю: де — часткові коефіцієнти кореляції, які характеризують тісноту зв'язку між факторними ознаками хlта хjза умови, що решта факторних ознак не впливає на цей зв'язок.За допомогою t-тесту перевіряють наявність лінійної кореляційної залеж­ності кожної пари факторних ознак. Порівняння розрахованих значень цих критеріїв з їхніми критичними значеннями дає можливість зробити висновки щодо наявності чи відсутності мультиколінеарності.

Алгоритм Феррара — Глобера складається з кількох кроків.Крок 1.Нормалізація факторних ознак x1,x2,..xk, яку здійснюють за допомогою перетворення , (7.78) де п — величина вибірки для кожної змінної (i=1,n); k-кількість факторних ознак у моделі (j=1,k); — середнє значення j-ї факторної ознаки; — дисперсіяj-ї факторної ознаки.

Для нормалізованих значень факторних ознак виконуються умови: Крок 2.Обчислення кореляційної матриці де X* — матриця нормалізованих значень факторних ознак.

Елементами матриці Rє парні коефіцієнти кореляції, які харак­теризують тісноту зв'язку між l-юта j-ю факторними ознаками. Однак на підставі знайденої кореляційної матриці В не можна ствер­джувати, що отриманий зв'язок є явищем мультиколінеарності.Крок 3. Обчислення значення -критерію — , де — визначник кореляційної матриці R. Знаходимо табличне значення при ступенях вільності і рівні значущості α. Якщо , тоімовірністю р=1-α можна стверджувати, що в ма­сиві факторних ознак є мультиколінеарність. Якщо , то з імовірністю р=1-α можемо зробити висновок щодо відсутності мультиколінеарності.Крок 4. Визначення матриці помилок С=.Крок 5.Розрахунок значень F-критерію — де -діагональні елементи матриці С. При заданих ступенях вільності n-k і k-1 та рівні значущості α знахо­димо табличне значення критерію і порівнюємо розраховані значення з табличним .Якщо > , то з імовірністю р=1-α гіпотезу Н0 відкидаємо, а це означає, що j-та факторна ознака колінеарна з усіма іншими і потрібно вирі­шити питання про її вилучення з переліку змінних моделі. Якщо , то з імовірністю р=1-α гіпотезу Н0 приймаємо, тобто факторна ознака хj не є колінеарною з усіма іншими. На підставі діагональних елементів матриці С можна розрахувати коефі­цієнти детермінації для кожної факторної ознаки: .Коефіцієнт детермінації характеризує вплив усіх інших факторних ознак на факторну змінну хj.Крок 6. Обчислення часткових коефіцієнтів кореляції, які характеризують тісноту зв'язку між двома факторними ознаками за умови, що всі інші фак­торні ознаки не впливають на цей зв'язок (тестування наявності парної колі-неарності) —

де — елемент матриці С, який розміщений на перетині l-їстрічки та j-го стовпця; діагональні елементи матриці С.

Якщо порівняти деякі кількісні значення часткових і парних коефіцієнтів кореляції, то можна побачити, що перші значно менші від других. Отже, на підставі лише часткових коефіцієнтів кореляції висновок про парну коліне-арність зробити неможливо. Для цього потрібно виконати ще сьомий крок.

Крок 7.Розрахунок значень t-критерію — Розраховані значення критерію порівнюємо з табличним значенням при n-kступенях вільності і рівні значущості α. Якщо то з імовірністю р=1-α гіпотезу Н0відкидаємо, тобто між факторними ознаками xlі хj наявна колінеарність. Якщо то з імовірністю р=1-α гіпотезу Н0приймаємо, тобто факторні ознаки хl і хj неколінеарні.

Аналізуючи значення критеріїв Fі t,можна зробити висновок, яку з фак­торних ознак потрібно вилучити з розгляду у побудованій кореляційно-рег­ресійній моделі, це варто робити з огляду на економічні та логіко-теоретичні міркування. Якщо за допомогою алгоритму Феррара — Глобера не можна визначити, яку факторну ознаку потрібно вилучити з переліку змінних моделі, то оці­нювати параметри моделі методом найменших квадратів не варто. У такому разі використовують інші методи, наприклад, метод головних компонент або одну з його модифікацій.

44. Узагальнений метод найменших квадратів (матричний підхід)

На відміну від звичайного методу найменших квадратів, узагальнений метод найменших квадратів ураховує інформацію про неоднаковість дисперсії і тому дає можливість одержати найкращі лінійні оцінки.

Розглянемо узагальнену множинну лінійну кореляційно-регресійну модель, зображену в матричному вигляді:

цеY - це n-вимірна матриця-стовпець спостережень за результуючою змінною у; X - матриця спостережень розмірності п*(k + 1) за факторними ознаками х1,...,хk, у якій елементами першого стовпця є одиниці для одержання вільного члена моделі, а інші стовпці є векторами спостережень за фактор­ними ознаками х1,...,хk; β – (k+1) - вимірна матриця-стовпець невідомих параметрів моделі; ε – n-вимірна матриця-стовпець випадкових величин εі.

Вибіркова кореляційно-регресійна модель має вигляд:

де Ỹ- n-вимірна матриця-стовпець теоретичних значень результуючої змінної, що розраховані на підставі кореляційно-регресійної моделі; b – (k+1) – вимірна матриця-стовпець оцінок параметрів кореляційно-регресійної моделі.

Позначимо через е = Y-Ỹ вектор випадкових відхилень.

Завдання полягає у знаходженні оцінок елементів вектора β у моделі. Для цього використовують матрицю S, за допомогою якої коригують вхідну ін­формацію.

Оскільки S — додатно визначена матриця, то вона може бути представле­на як добуток РРТ, де матриця Р є ненародженою, тобто S = РРТ.

При заданій матриці S оцінки параметрів моделі можна обчислити за формулою

стандартну похибку — згідно . Отже, ми можемо побудуватидовірчі інтервалитакритерії перевіряння статистичної значущості параметрів регресії β.

Дисперсія трансформованої похибки ε є постійною величиною, тобто для моделі

P-1Y=P-1Xβ+P-1ε виконується припущення про гомоскедастичність і оцінювання її параметрів можна проводити на підставі методу найменших квадратів.