Регрессионный анализ при наличии ошибок в факторах

Четвертая предпосылка классического РА состоит в том, что факторы Х_i эксперимента являются не случайными величинами. Нарушение этой предпосылки является чаще всего встречающимся на практике отклонением от классических требований. В активных экспериментах не всегда удается устанавливать факторы на требуемых уровнях. В пассивных экспериментах невозможно измерение факторов с абсолютной точностью и ошибка измерений является величиной случайной (в противном случае ее можно устранить или учесть). Поэтому большое значение имеют проверка выполнения 4-й предпосылки, анализ влияния ошибок в факторах на точность регрессионной модели и разработка методов устранения искажающего влияния этих ошибок.

Ошибки установки возникают из-за того, что выбранные по плану эксперимента требуемые уровни факторов Х_iтр не могут быть реализованы из-за случайным образом изменяющихся размеров заготовок или образцов, неточностей в работе оборудования и т.п. Поэтому фактические значения факторов равны:

, (11.1)

где δХ_i – случайная ошибка установки факторов.

Считается, что случайная величина имеет μ(δХ_i) = 0, σ²(δХ_i) = 0и она не коррелированна с Х_iтр и между собой. В таком случае полученные МНК оценки коэффициентов регрессии являются не смещенными. Оценивание коэффициентов линейных моделей с ошибками в установке уровней факторов можно производить обычным МНК. Наличие ошибок установки приводит только к увеличению дисперсии отклика (дисперсии эксперимента) S²(y), поскольку она будет зависеть не тоько от помех e_i, но и от δХ_i,которые действуют как добавочный шум.

При оценивании коэффициентов нелинейных моделей, т.е. таких, в которых есть Х_iХ_j, Х²_iили другие функции от факторов, ошибки установки факторов приводят к смещенным оценкам коэффициентов регрессии. В таких случаях для нахождения несмещенных оценок необходимо применение специальных методов.

При наличии ошибок в измерениях факторов, что обычно имеет место в пассивных экспериментах, вместо истинных Х_iu приходится иметь дело с наблюдаемыми значениями Х_i_н:

. (11.2)

В отличие от ошибок установки ошибки измерения не передаются на вход объекта исследования и не увеличивают дисперсию эксперимента. Но даже в случае простейших линейных моделей они приводят к смещению МНК-оценок коэффициентов регрессии a_i, т.е. возникает систематическая ошибка в оценке a_i:

(11.3)

гдеγ– относительная погрешность измерительного прибора:

. (11.4)

Смещение (11.3) возрастает пропорционально погрешности измерительного прибора.

Ошибки измерения факторов приводят к увеличению дисперсии оценок коэффициентов регрессии, т.е. снижают эффективность оценок. Их можно считать несущественными, если:

γ<<1(11.5)

(11.6)

Условие (11.5) означает малость смещения обычной МНК-оценки. Условие (11.6) означает, что дисперсия обычной МНК-оценки a_i, найденная при наличии ошибок в измерениях факторов, незначительно отличается от дисперсии оценки, определенной при отсутствии таких ошибок.