Понятие об интервальной оценке параметров.

 

При оценке вероятностных характеристик по ограниченному числу опытов могут быть допущены ошибки, т. е. отклонения этой оценки от истинного значения характеристики случайной величины.

Чтобы убедиться в том, что мы не допускаем чрезмерно грубой ошибки в оценке какой-то вероятностной характеристики, в теории вероятностей и математической статистике пользуются так называемыми доверительными интервалами и доверительными вероятностями.

Интервальной называют оценку, которая определяется двумя числами – концами интервала.

Допустим, что для изучения некоторой случайной величины X (признака генеральной совокупности) необходимо по статистическим данным произвести оценку неизвестного ее параметра θ (это может быть М(Х), D(Х) или р) с определенной степенью точности и надежности, т. е. надоуказать границы, в которых практически достоверно лежит этот неизвестный параметр θ.

Это означает, что надо найти такую выборочную оценку для искомого параметра θ, при которой с наибольшей вероятностью(надежностью) будет выполняться неравенство:

Отсюда видно, что чем меньше e, тем точнее характеризуется неизвестный параметр θ с помощью выборочной оценки . Следовательно, число e характеризует точность оценки параметра θ.

Надежность выполнения неравенства оценивается числом g (α = 1 – γ), которое называют доверительной вероятностью:

g = Р(). (1.11)

 

Итак, число e характеризует точность оценки параметраθ; число g – характеризует надежность оценки параметра θ.

В практических задачах либо заранее задается надежность g (риск α) и надо найти точность оценки, либо, наоборот, задается точность e, а требуется определить надежность оценки.

Как правило, доверительную вероятность g задают числом, близким к единице: 0,95; 0,97; 0,99; 0,999.

Формула (1.11) означает, что с вероятностью g неизвестное значение параметра θ находится в интервале Ig = ( e, + e).

Очевидно, чем больше требуется точность e (т. е., чем меньше длина интервала), тем меньше вероятность накрыть интервалом Ig искомый параметр θ, и, наоборот, с уменьшением точности e (увеличением длины интервала) увеличивается надежность g накрыть интервалом Igпараметр θ (рис. 1.5).

 

 

Рис. 1.5. Доверительный интервал

 

Замечание. Если число g = 0,95, это означает, что в среднем в 95 случаях из 100 интервал Ig накроет параметр θ и в 5 случаях из 100 не накроет его.

 

Оценка , будучи функцией случайной выборки, является случайной величиной, ε также случайна: ее значение зависит от вероятности γ и, как правило, от выборки. Поэтому доверительный интервал случаен и выражение (1.11) следует читать так: «Интервал (ε, +ε) накроет параметр θ с вероятностью γ», а не «Параметр θ попадет в интервал (ε, +ε) с вероятностью γ».

В формуле (1.11) границы доверительного интервала симметричны относительно точечной оценки . Однако не всегда удается построить интервал, обладающий таким свойством. Для получения доверительного интервала наименьшей длины при заданном объеме выборки п и заданной доверительной вероятности γ в качестве оценки параметра θ следует брать эффективную или асимптотически эффективную оценку.

Существует два подхода к построению доверительных интервалов. Первый подход, если его удается реализовать, позволяет строить доверительные интервалы при каждом конечном объеме выборки п. Он основан на подборе такой функции , называемой в дальнейшемстатистикой, чтобы

1) ее закон распределения был известен и не зависел от θ;

2) функция была непрерывной и строго монотонной по θ.

Задавшись доверительной вероятностью γ, связанной с риском α формулой γ = 1 – α, находят двусторонние критические границы и , отвечающие вероятности α. Тогда с вероятностью γ выполняется неравенство

 

. (1.12)

 

Решив это неравенство относительно θ, находят границы доверительного интервала для θ. Если плотность распределения статистики симметрична относительно оси Оу, то доверительный интервал симметричен относительно .

Второй подход, получивший название асимптотического подхода, более универсален; однако он использует асимптотические свойства точечных оценок и поэтому пригоден лишь при достаточно больших объемах выборки.

Рассмотрим первый подход на примерах доверительного оценивания параметров нормального распределения.