1. Интервальное оценивание параметров распределения. Доверительная вероятность и доверительный интервал.
2. Доверительные интервалы для математического ожидания. Оценивание дисперсии в статистике интервальных данных.
1.
После получения точечной оценки θ* желательно иметь данные о надежности такой оценки. Особенно важно иметь сведения о точности оценок для небольших выборок (поскольку с возрастанием объема выборки состоятельность и несмещенность основных оценок гарантируется утверждениями математической статистики). Поэтому точечная оценка может быть дополнена интервальной оценкой.
Определение. Интервальной оценкой параметра θ называется числовой интервал (θ1, θ2), который с заданной вероятностью γ накрывает неизвестное значение параметра θ.
Границы интервала (θ1, θ2)и его величина находятся по выборочным данным и поэтому являются случайными величинами в отличии от оцениваемого параметра θ – величины неслучайной, поэтому правильнее говорить, что интервал «накрывает», а не содержит значение θ.
Такой интервал (θ1, θ2) называется доверительным, а вероятность γ (уровня значимости α=1-γ) – доверительной вероятностью, уровнем доверия или надежностью оценки. Выбор α или ᵞ определяются конкретными условиями. Обычно используется α=0,1;0,05; 0,01 , что соответствует 90, 95, 99%-м доверительным интервалам.
Величина доверительного интервала существенно зависит от объема выборки n (уменьшается с ростом n) и от значения доверительной вероятности γ (увеличивается с приближением γ к единице).
Очень часто доверительный интервал выбирается симметричным относительно параметра θ, т.е. (θ-∆, θ+∆)
Наибольшее отклонение ∆ оценки θ*n от оцениваемого параметра θ, в частности, выборочной средней (или доли) от генеральной средней (или доли), которое возможно с заданной доверительной вероятностью γ, называется предельной ошибкой выборки.
Ошибка ∆ является ошибкойрепрезентативности (представительства) выборки. Она возникает только вследствие того, что исследуется не вся совокупность, а лишь часть ее, отобранная случайно. Эту ошибку называют случайной ошибкой репрезентативности.
2.
Доверительные интервалы строятся, как правило, в предположении нормальности данных.
Предположим, наблюдается случайная величина.Для параметров строятся следующие точные доверительные интервалы:
1.Для неизвестного среднего при известной дисперсии :
, где определяется из соотношения .
2.Для неизвестного среднего при неизвестной дисперсии :
, где - критическая точка распределения Стьюдента (для двусторонней области) с n-1 степенью свободы, на уровне значимости .
3.Для неизвестной дисперсии :
, где и - критические точки - распределения с n-1 степенью свободы и уровнем значимости .
4.По выборке ,…,можно построить доверительные интервалы для следующего (n+1)-го наблюдения (это может быть полезным в качестве прогноза на будущее):
.