Тема 3. Интервальное оценивание

1. Интервальное оценивание параметров распределения. Доверительная вероятность и доверительный интервал.

2. Доверительные интервалы для математического ожидания. Оценивание дисперсии в статистике интервальных данных.

После получения точечной оценки θ^* желательно иметь данные о надежности такой оценки. Особенно важно иметь сведения о точности оценок для небольших выборок (поскольку с возрастанием объема выборки состоятельность и несмещенность основных оценок гарантируется утверждениями математической статистики). Поэтому точечная оценка может быть дополнена интервальной оценкой.

Определение. Интервальной оценкой параметра θ называется числовой интервал (θ₁, θ₂), который с заданной вероятностью γ накрывает неизвестное значение параметра θ.

Границы интервала (θ₁, θ₂)и его величина находятся по выборочным данным и поэтому являются случайными величинами в отличии от оцениваемого параметра θ – величины неслучайной, поэтому правильнее говорить, что интервал «накрывает», а не содержит значение θ.

Такой интервал (θ₁, θ₂) называется доверительным, а вероятность γ (уровня значимости α=1-γ) – доверительной вероятностью, уровнем доверия или надежностью оценки. Выбор α или ᵞ определяются конкретными условиями. Обычно используется α=0,1;0,05; 0,01 , что соответствует 90, 95, 99%-м доверительным интервалам.

Величина доверительного интервала существенно зависит от объема выборки n (уменьшается с ростом n) и от значения доверительной вероятности γ (увеличивается с приближением γ к единице).

Очень часто доверительный интервал выбирается симметричным относительно параметра θ, т.е. (θ-∆, θ+∆)

Наибольшее отклонение ∆ оценки θ*_n от оцениваемого параметра θ, в частности, выборочной средней (или доли) от генеральной средней (или доли), которое возможно с заданной доверительной вероятностью γ, называется предельной ошибкой выборки.

Ошибка ∆ является ошибкойрепрезентативности (представительства) выборки. Она возникает только вследствие того, что исследуется не вся совокупность, а лишь часть ее, отобранная случайно. Эту ошибку называют случайной ошибкой репрезентативности.

Доверительные интервалы строятся, как правило, в предположении нормальности данных.

Предположим, наблюдается случайная величина.Для параметров строятся следующие точные доверительные интервалы:

1.Для неизвестного среднего при известной дисперсии :

, где определяется из соотношения .

2.Для неизвестного среднего при неизвестной дисперсии :

, где - критическая точка распределения Стьюдента (для двусторонней области) с n-1 степенью свободы, на уровне значимости .

3.Для неизвестной дисперсии :

, где и - критические точки - распределения с n-1 степенью свободы и уровнем значимости .

4.По выборке ,…,можно построить доверительные интервалы для следующего (n+1)-го наблюдения (это может быть полезным в качестве прогноза на будущее):