В измерении факторов

Известны два подхода к учету ошибок измерения, отличающиеся степенью использования априорной информации об ошибках измерения. Первый подход реализуется в методах инструментальных переменных и в методе группирования. Эти методы не требуют знания дисперсии ошибок измерения , но предполагают, что ошибки имеют нулевое математическое ожидание и не коррелированны между собой и с Хi.

Идея метода инструментальных переменных состоит в том, что ищется новая переменная ξi такая, что в каждом i-том опыте она сильно коррелированна с истинным значением X0i и слабо или совсем не корелированна с . Примерами инструментальных переменных являются:

1. ξi = –1, если ; ξi = +1, если ; ξi = 0, если , т.е. производится квантование на трех уровнях относительно среднего арифметического . Если есть основания полагать, что распределение X0i несимметрично, то рекомендуется вместо брать значение медианы .

2. ξiзапаздывающая переменная, т.е. ξi = Хi–1.Предполагается, что

ошибки в соседних факторах не коррелированны, а истинная перемен-

ная имеет высокую корреляцию между соседними опытами.

3. ξi =.

Из рассмотренных примеров видно, что выбор инструментальной переменной в значительной степени обусловлен видом (в общем случае неизвестным) изменения переменной X0i в N опытах и поэтому не формализован. Если переменная выбрана, то оценку находят по формуле:

(11.7)

При удачном выборе инструментальной переменной найденные оценки будут асимптотически несмещенными. Уменьшение смещенности в этом методе достигается за счет уменьшения эффективности оценки.

В методе группирования для получения несмещенной оценки коэффициента регрессии данные группируют – совокупность значений Хiи Yiв N опытах разбивают на К интервалов и вычисляют среднее по каждому интервалу Х и Yи общее среднее. Оценку находят по формуле:

(11.8)

где ; К – число интервалов;

j– номер интервала; g – номер измерения в j-том интервале;

Nj – число измерений в j-том интервале; - среднее значение в j - том интервале. Обозначения для откликов аналогичны.

Найденная по (10.8) оценка состоятельна. Простота обоих рассмотренных методов сопряжена с их недостатками:

1. Эти методы не используют обычно имеющуюся информацию о , что сильно обедняет получающиеся результаты;

2. Их применение не формализовано и поэтому результат в значительной степени зависит от опыта исследователя;

3. Эти методы применимы только для линейных относительно переменных и параметров моделей.

Второй подход основан на методе максимального правдоподобия. Предполагается, что случайные величины δХi и еi имеют совместное нормальное распределение, известна не только дисперсия ошибки измерения , но и дисперсия внешнего шума е. Этот подход позволяет получать достаточно хорошие в статистическом отношении результаты и в рамках выдвинутых предположений дает состоятельные и несмещенные оценки. Однако практически его использование сильно затруднено, т.к. если оценку можно получить априори, то оптимальную по своим свойствам дисперсию можно найти только после проведения полного регрессионного анализа, т.к. случайная величина еi есть результат воздействия всех неконтролируемых случайных факторов. Ниже дается метод коррекции, который позволяет в некоторой степени обойти указанные трудности.

В основе метода лежат достаточно общие предпосылки, которые выполняются в большинстве практических случаев: ошибки измерения имеют нулевое математическое ожидание; они не коррелированны между собой и с факторами; известны оценки дисперсий ошибок измерения.

Если ошибки измерения велики, то скорректированную величину любого коэффициента регрессии можно найти по формуле:

(11.9)

Если все эти методы не дают положительного результата, тогда нужно увеличить число наблюдений N, уточнить оценки дисперсий или применить более точный прибор, чтобы уменьшить γ и провести эксперимент заново.

Если ошибки измерений подчиняются нормальному закону, то распределения скорректированных оценок, а также оценок, найденных методами инструментальных переменных и группирования, являются асимптотически нормальными. Это позволяет проверять статистические гипотезы и строить доверительные интервалы, пользуясь стандартными критериями.