Статистическое оценивание параметров распределения

Мы анализируем только выборки из генеральной совокупности. По средне выборочным параметрам находим параметры самой генеральной совокупности.

Задачи такого рода решаются методами проверки статистических гипотез и статистической оценки параметров распределения.

Прежде нужно получить и провести первичную обработку исходных экспериментальных данных.

Статистические ряды часто изображают графически в виде полигона, гистограммы, кумулятивной кривой F^*(x).

Полигон – ломаная линия, соединяющая в декартовой системе координат точки (x_i,n_i), (x_i,m_xi).

Кумулятивная кривая строится по точкам (x_i,F^*(x_i)).

Гистограмма – на оси абсцисс – отрезки интервалов t, на этих интервалах строятся прямоугольники с высотой, равной относительной частоте признака. По гистограмме легко строится полигон.

И полигон, и гистограмма характеризуют функцию f^*(x) – плотность вероятности.

НСВ – проблема выбора интервала варьирования h.

h выбирается, исходя из необходимости выявления характерных черт рассматриваемого распределения.

Правило Старджесса:

Как только характерные особенности распределения проявились, ставится вопрос об условиях, при которых сформировалось данное распределение – вопрос об однородности статистических данных.

Если функция f^*(x) – бимодальная (имеет два максимума), то статистическое данные неоднородные.

Методы математической статистики должны позволить сделать обоснованные выводы о числовых параметрах и законе распределения генеральной совокупности по ограниченному числу выборок из этой совокупности.

Состав выборок случаен и выводы могут быть ложными. С увеличением объема выборки вероятность правильных выводов растет. Всякому решению, принимаемому при статистической оценке параметров, ставится в соответствие некоторая вероятность, характеризующая степень достоверности принимаемого решения.

Задачи оценки параметров распределения ставятся следующим образом:

Есть СВ Х, характеризуемая функцией F(X, q).

q – параметр, подлежащий оценке.

Делаем m независимых выборок объемом n элементов x_ij (i – номер выборки, j – номер элемента в выборке).

1 x₁₁, x₁₂, …, x_1n X₁

2 x₂₁, x₂₂, …, x_2n X₂

…

m x_m₁, x_m₂, …, x_mn X_m

Случайные величины X₁, X₂,…X_m мы рассматриваем как m независимых СВ, каждая из которых распределена по закону F(X, q).

Всякую однозначную функцию наблюдений над СВ х, с помощью которой судят о значении параметра q, называют – оценкой параметра q.

Выбор оценки, позволяющей получить хорошее приближение к оцениваемому параметру – задача исследования.

Основные свойства оценок

Несмещенность, эффективность и состоятельность.

Оценка параметра q называется несмещенной, если M()=q.

Если – в оценке параметра q имеется систематическая ошибка.

Несмещенность оценки гарантирует отсутствие систематической ошибки в оценке параметра.

Несмещенных оценок может быть несколько.

– несмещенная оценка q.

Разброс параметров или рассеяние величины относительно математического ожидания q характеризует дисперсия D(), D().

Из двух или более несмещенных оценок предпочтение отдается оценке, обладающей меньшим рассеянием относительно оцениваемого параметра.

Оценка называется состоятельной, если она подчиняется закону больших чисел:

На практике не всегда удается удовлетворить одновременно всем трем требованиям.

Оценка математического ожидания по выборке

Теорема 1. Среднее арифметическое по n независимым наблюдениям над СВ x с МО m является несмещенной оценкой этого параметра.

Доказательство: x₁,x₂,…,x_n M(x)=m M(x₁)=M(x₂)=…=M(x_n)=m

Теорема 2. Среднее арифметическое по n независимым наблюдениям над СВ x с МО m и дисперсией D(x)=s² является состоятельной оценкой МО.

Доказательство: D(x)=s² D(x₁)=D(x₂)=…=D(x_n)=s²

Теорема 3. Если СВ Х распределена по нормальному закону с параметрами (m,s²), то несмещенная и состоятельная оценка МО m имеет минимальную дисперсию s²/n => является и эффективной.

Оценки дисперсии по выборке

Если случайная выборка состоит из n независимых наблюдений над СВ Х с M(X)=m и D(X)=s², то выборочная дисперсия не является несмещенной оценкой дисперсии генеральной совокупности.

Несмещенной оценкой D(x) является , .

Легко доказать по формуле Чебышева, что оценки S2 и являются состоятельными оценками дисперсии.

Несмещенная, состоятельная и эффективная оценка дисперсии:

Если МО генеральной совокупности неизвестно, то используют .

Существуют регулярные методы получения оценок параметров генеральной совокупности по данным выборок.