Выявление мультиколлинеарности

Для получения качественных результатов РА необходимо выявление мультиколлинеарности в ходе РА или возможности ее появления при подготовке и сборе данных.

Внешним признаком мультиколлинеарности после проведения РА являются слишком большие значения коэффициента регрессии и их дисперсий S²(a_i). Однако точно установить наличие этого явления можно по матрице коэффициентов парной корреляции факторов, которая рассчитывается в ходе РА:

(9.3)

Если хотя бы один из r_ij матрицы (9.3) больше 0,9, то между соответствующими факторами имеется сильная корреляционная связь и можно ожидать появления мультиколлинеарности. О мультиколлинеарности можно судить и по определителю матрицы (9.3). Если все факторы не коррелированы между собой, то det R = 1; в противном случае det R < 1. При строгой мультиколлинеарности хотя бы один r_ij = 1, а det R = 0.

Корреляция между факторами позволяет дать наглядное представление о сущности мультиколлинеарности и ее внешних признаках. В простейшем случае двух переменных х₁ и х₂ при r = 1 все точки факторного пространства будут лежать на одной прямой (рис.9.2).

Рисунок 9.2– Расположение точек в факторном пространстве

при строгой мультиколлинеарности

Если же r_ij >0,9, то тогда экспериментальные точки будут группироваться возле прямой (рис.9.3).

Х₁

Рисунок 9.3 – Расположение точек в факторном пространстве

при наличии мультиколлинеарности

В 3-х мерном пространстве в первом случае отклики будут лежать на одной линии в плоскости откликов, а во втором – рассеиваться возле этой линии. Провести плоскость через линию можно как угодно

(т.е. положение плоскости откликов не определено однозначно), а через точки, группирующиеся возле линии – очень трудно. Задача "плохо" определена – небольшие изменения в расположении точек будут приводить к значительным изменениям в положении плоскости откликов.

Подобная ситуация часто возникает и при группировании экспериментальных точек в одном месте (рис.9.4), что довольно часто встречается в пассивных экспериментах.

Рисунок 9.4 – Возможное расположение точек при пассивном

эксперименте

Поскольку МНК минимизирует сумму квадратов отклонений от всех точек, то точки, значительно отклоняющиеся от основной массы (т.н. "выбросы"), играющие решающую роль в определении поверхности отклика, из-за своей малочисленности будут играть меньшую роль. что также делает задачу "плохо" определенной.