Методы предварительного центрирования независимых переменных и регуляризации

Плохая обусловленность информационной матрицы особенно характерна для полиномиальной регрессии. В этом случае весьма полезным является предварительное центрирование независимых переменных. Суть метода – в предварительном центрировании факторов хi и только после этого выполняется вычисление базисных функций fji).

Предварительное центрирование осуществляется вычитанием средних арифметических из их наблюдаемых значений:

.

Эта процедура резко уменьшает коэффициенты корреляции между независимыми переменными хi и их степенями хi2, xi3..., а также между х и взаимодействиями, включающими хiхj, хi2хj ... . Однако предварительное центрирование не может помочь, если есть сильная корреляция между линейными эффектами хiи хj, i≠j. В этом случае может помочь метод регуляризации.

Идея метода такова. При плохой обусловленности информационной матрицы МНК-оценки b = (FTF)-1FTyнеустойчивы и обычно очень велики (относительно истинных значений коэффициентов). Для их стабилизации предложено при решении системы нормальных уравнений вместо матрицы FTFиспользовать матрицу (FTF+rI),в которой r - некоторое положительное малое число, I – единичная матрица размером

(N×N). Тогда оценки коэффициентов регрессии: