Выборочная средняя, её свойства

19. Выборочная средняя, её свойства.

Вы́борочное (эмпири́ческое) сре́днее — это приближение теоретического среднего распределения, основанное на выборке из него.

Определение: Пусть — выборка из распределения вероятности, определённая на некотором вероятностном пространстве . Тогда её выборочным средним называется случайная величина.

Свойства выборочного среднего :

Пусть — выборочная функция распределения данной выборки. Тогда для любого фиксированного функция является (неслучайной) функцией дискретного распределения. Тогда математическое ожидание этого распределения равно

Выборочное среднее — несмещённая оценка теоретического среднего:

.

Выборочное среднее — сильно состоятельная оценка теоретического среднего:

почти наверное при .

Выборочное среднее — асимптотически нормальная оценка. Пусть дисперсия случайных величин конечна и ненулевая, то есть .

Тогда

по распределению при ,

где — нормальное распределение со средним и дисперсией .

Выборочное среднее из нормальной выборки — эффективная оценка её среднего

 

Выборочная дисперсия, её свойства.

Выборочная дисперсия в математической статистике — это оценка теоретической дисперсии распределения на основе выборки. Различают выборочную дисперсию и несмещённую, или исправленную, выборочные дисперсии.

Определения

Пусть — выборка из распределения вероятности. Тогда

Выборочная дисперсия — это случайная величина

,

где символ обозначает выборочное среднее.

Несмещённая (исправленная) дисперсия — это случайная величина

.

 

Замечание

Очевидно,

.

Свойства выборочных дисперсий

Обе выборочные дисперсии являются состоятельными оценками теоретической дисперсии. Если , то И , где обозначает сходимость по вероятности.

Статистические оценки: несмещенные, эффективные, состоятельные

Рассмотрим оценку θn числового параметра θ, определенную при n = 1, 2, … Оценка θnназывается состоятельной, если она сходится по…   Пример 3. Из закона больших чисел следует, что θn = является состоятельной оценкой θ = М(Х) (в…

Точечные и интервальные оценки.

Для того чтобы точечные статистические оценки обеспечивали “хорошие” приближения неизвестных параметров, они должны быть несмещенными,… Определение :Пусть — случайная выборка из распределения, зависящего от… Формально статистика может не иметь ничего общего с интересующим нас значением параметра . Её полезность для…

Определение

Пусть - неизвестный параметр генеральной совокупности. По сделанной выборке по определенным правилам находятся числа и такие чтобы выполнялось неравенство:

 

Интервал является доверительным интервалом для параметра , а число - доверительной вероятностью или надежностью сделанной оценки. Обычно надежность задается заранее, причем выбираются числа близкие к 1 (0.95, 0.99 или 0.999).

Примеры интервальных оценок

Пример 1. Доверительное оценивание по вариационному ряду.

Пусть задана выборка некоторой случайной величины Построим вариационный ряд выборки

 

 

Очевидно, что вероятность попасть в любой из - го интервалов значений случайной величины одинакова и равна Тогда вероятность того, что случайная величина приняла значение из интервала где будет равна:

 

Вопрос: чему должен быть равен размер выборки чтобы вероятность попасть в интервал составила 95%.

Подставляя значение для доверительной вероятности в формулу выше, получим:

 

откуда

Таким образом, при достаточном для заданной доверительной вероятности числе измерений случайной величины по набору ее порядковых статистикможет быть оценен диапазон принимаемых ею значений.

Пример 2. Доверительный интервал для медианы.

Пусть задана выборка некоторой случайной величины

При доверительный интервал для медианы определяется порядковыми статистиками

 

где

при

при

при

Для значений номера порядковых статистик, заключающих в себе медиану, при и приведены в таблице 1, взятой из [3].

Пример 3. Доверительный интервал для математического ожидания.

Пусть задана выборка некоторой случайной величины , арактеристики которой (дисперсия D и математическое ожидание M) неизвестны. Эти параметры оценим так:

 

- несмещенная оценка дисперсии.

Величину называют оценкой среднего квадратического отклонения. Воспользуемся тем, что величина представляет собой сумму независимых случайных величин, и, согласно центральной предельной теореме, при достаточно большом ее закон близок к нормальному. Поэтому будем считать, что величина распределена по нормальному закону. Характеристики этого закона - математическое ожидание и дисперсия - равны соответственно M (настоящее МО случайной величины ) и .

Найдем такую величину , для которой . Перепишем это в эквивалентном виде и скажем, что случайная величина перед знаком неравенства есть модуль от стандартной нормальной. Получаем, что , и . В случае неизвестной дисперсии ее можно заменить на оценку .

Например, выбирая , получаем коэффициент

Окончательно: с вероятностью можно сказать, что

Точность и надежность оценки, доверительный интервал.