Плохая обусловленность информационной матрицы особенно характерна для полиномиальной регрессии. В этом случае весьма полезным является предварительное центрирование независимых переменных. Суть метода – в предварительном центрировании факторов хi и только после этого выполняется вычисление базисных функций fj (хi).
Предварительное центрирование осуществляется вычитанием средних арифметических из их наблюдаемых значений:
.
Эта процедура резко уменьшает коэффициенты корреляции между независимыми переменными хi и их степенями хi2, xi3..., а также между х и взаимодействиями, включающими хiхj, хi2хj ... . Однако предварительное центрирование не может помочь, если есть сильная корреляция между линейными эффектами хiи хj, i≠j. В этом случае может помочь метод регуляризации.
Идея метода такова. При плохой обусловленности информационной матрицы МНК-оценки b = (FTF)-1FTyнеустойчивы и обычно очень велики (относительно истинных значений коэффициентов). Для их стабилизации предложено при решении системы нормальных уравнений вместо матрицы FTFиспользовать матрицу (FTF+rI),в которой r - некоторое положительное малое число, I – единичная матрица размером
(N×N). Тогда оценки коэффициентов регрессии: