Регрессионный анализ при наличии ошибок в факторах

Четвертая предпосылка классического РА состоит в том, что факторы Хi эксперимента являются не случайными величинами. Нарушение этой предпосылки является чаще всего встречающимся на практике отклонением от классических требований. В активных экспериментах не всегда удается устанавливать факторы на требуемых уровнях. В пассивных экспериментах невозможно измерение факторов с абсолютной точностью и ошибка измерений является величиной случайной (в противном случае ее можно устранить или учесть). Поэтому большое значение имеют проверка выполнения 4-й предпосылки, анализ влияния ошибок в факторах на точность регрессионной модели и разработка методов устранения искажающего влияния этих ошибок.

Ошибки установки возникают из-за того, что выбранные по плану эксперимента требуемые уровни факторов Хiтр не могут быть реализованы из-за случайным образом изменяющихся размеров заготовок или образцов, неточностей в работе оборудования и т.п. Поэтому фактические значения факторов равны:

, (11.1)

где δХi – случайная ошибка установки факторов.

Считается, что случайная величина имеет μ(δХi) = 0, σ2(δХi) = 0и она не коррелированна с Хiтр и между собой. В таком случае полученные МНК оценки коэффициентов регрессии являются не смещенными. Оценивание коэффициентов линейных моделей с ошибками в установке уровней факторов можно производить обычным МНК. Наличие ошибок установки приводит только к увеличению дисперсии отклика (дисперсии эксперимента) S2(y), поскольку она будет зависеть не тоько от помех ei, но и от δХi,которые действуют как добавочный шум.

При оценивании коэффициентов нелинейных моделей, т.е. таких, в которых есть ХiХj, Х2iили другие функции от факторов, ошибки установки факторов приводят к смещенным оценкам коэффициентов регрессии. В таких случаях для нахождения несмещенных оценок необходимо применение специальных методов.

При наличии ошибок в измерениях факторов, что обычно имеет место в пассивных экспериментах, вместо истинных Хiu приходится иметь дело с наблюдаемыми значениями Хiн:

. (11.2)

В отличие от ошибок установки ошибки измерения не передаются на вход объекта исследования и не увеличивают дисперсию эксперимента. Но даже в случае простейших линейных моделей они приводят к смещению МНК-оценок коэффициентов регрессии ai, т.е. возникает систематическая ошибка в оценке ai:

(11.3)

гдеγ– относительная погрешность измерительного прибора:

. (11.4)

Смещение (11.3) возрастает пропорционально погрешности измерительного прибора.

Ошибки измерения факторов приводят к увеличению дисперсии оценок коэффициентов регрессии, т.е. снижают эффективность оценок. Их можно считать несущественными, если:

γ<<1(11.5)

(11.6)

Условие (11.5) означает малость смещения обычной МНК-оценки. Условие (11.6) означает, что дисперсия обычной МНК-оценки ai, найденная при наличии ошибок в измерениях факторов, незначительно отличается от дисперсии оценки, определенной при отсутствии таких ошибок.