В измерении факторов

Известны два подхода к учету ошибок измерения, отличающиеся степенью использования априорной информации об ошибках измерения. Первый подход реализуется в методах инструментальных переменных и в методе группирования. Эти методы не требуют знания дисперсии ошибок измерения , но предполагают, что ошибки имеют нулевое математическое ожидание и не коррелированны между собой и с Х_i.

Идея метода инструментальных переменных состоит в том, что ищется новая переменная ξ_i такая, что в каждом i-том опыте она сильно коррелированна с истинным значением X₀_i и слабо или совсем не корелированна с . Примерами инструментальных переменных являются:

1. ξ_i = –1, если ; ξ_i = +1, если ; ξ_i = 0, если , т.е. производится квантование на трех уровнях относительно среднего арифметического . Если есть основания полагать, что распределение X_0i несимметрично, то рекомендуется вместо брать значение медианы .

2. ξ_i –запаздывающая переменная, т.е. ξ_i = Х_i–1.Предполагается, что

ошибки в соседних факторах не коррелированны, а истинная перемен-

ная имеет высокую корреляцию между соседними опытами.

3. ξ_i =.

Из рассмотренных примеров видно, что выбор инструментальной переменной в значительной степени обусловлен видом (в общем случае неизвестным) изменения переменной X₀_i в N опытах и поэтому не формализован. Если переменная выбрана, то оценку находят по формуле:

(11.7)

При удачном выборе инструментальной переменной найденные оценки будут асимптотически несмещенными. Уменьшение смещенности в этом методе достигается за счет уменьшения эффективности оценки.

В методе группирования для получения несмещенной оценки коэффициента регрессии данные группируют – совокупность значений Х_iи Y_iв N опытах разбивают на К интервалов и вычисляют среднее по каждому интервалу Х и Yи общее среднее. Оценку находят по формуле:

(11.8)

где ; К – число интервалов;

j– номер интервала; g – номер измерения в j-том интервале;

N_j – число измерений в j-том интервале; - среднее значение в j - том интервале. Обозначения для откликов аналогичны.

Найденная по (10.8) оценка состоятельна. Простота обоих рассмотренных методов сопряжена с их недостатками:

1. Эти методы не используют обычно имеющуюся информацию о , что сильно обедняет получающиеся результаты;

2. Их применение не формализовано и поэтому результат в значительной степени зависит от опыта исследователя;

3. Эти методы применимы только для линейных относительно переменных и параметров моделей.

Второй подход основан на методе максимального правдоподобия. Предполагается, что случайные величины δХ_i и е_i имеют совместное нормальное распределение, известна не только дисперсия ошибки измерения , но и дисперсия внешнего шума е. Этот подход позволяет получать достаточно хорошие в статистическом отношении результаты и в рамках выдвинутых предположений дает состоятельные и несмещенные оценки. Однако практически его использование сильно затруднено, т.к. если оценку можно получить априори, то оптимальную по своим свойствам дисперсию можно найти только после проведения полного регрессионного анализа, т.к. случайная величина е_i есть результат воздействия всех неконтролируемых случайных факторов. Ниже дается метод коррекции, который позволяет в некоторой степени обойти указанные трудности.

В основе метода лежат достаточно общие предпосылки, которые выполняются в большинстве практических случаев: ошибки измерения имеют нулевое математическое ожидание; они не коррелированны между собой и с факторами; известны оценки дисперсий ошибок измерения.

Если ошибки измерения велики, то скорректированную величину любого коэффициента регрессии можно найти по формуле:

(11.9)

Если все эти методы не дают положительного результата, тогда нужно увеличить число наблюдений N, уточнить оценки дисперсий или применить более точный прибор, чтобы уменьшить γ и провести эксперимент заново.

Если ошибки измерений подчиняются нормальному закону, то распределения скорректированных оценок, а также оценок, найденных методами инструментальных переменных и группирования, являются асимптотически нормальными. Это позволяет проверять статистические гипотезы и строить доверительные интервалы, пользуясь стандартными критериями.