Статистическое оценивание параметров распределения

Мы анализируем только выборки из генеральной совокупности. По средне выборочным параметрам находим параметры самой генеральной совокупности.

Задачи такого рода решаются методами проверки статистических гипотез и статистической оценки параметров распределения.

Прежде нужно получить и провести первичную обработку исходных экспериментальных данных.

Статистические ряды часто изображают графически в виде полигона, гистограммы, кумулятивной кривой F*(x).

Полигон – ломаная линия, соединяющая в декартовой системе координат точки (xi,ni), (xi,mxi).

Кумулятивная кривая строится по точкам (xi,F*(xi)).

Гистограмма – на оси абсцисс – отрезки интервалов t, на этих интервалах строятся прямоугольники с высотой, равной относительной частоте признака. По гистограмме легко строится полигон.

И полигон, и гистограмма характеризуют функцию f*(x) – плотность вероятности.

НСВ – проблема выбора интервала варьирования h.

h выбирается, исходя из необходимости выявления характерных черт рассматриваемого распределения.

Правило Старджесса:

Как только характерные особенности распределения проявились, ставится вопрос об условиях, при которых сформировалось данное распределение – вопрос об однородности статистических данных.

Если функция f*(x) – бимодальная (имеет два максимума), то статистическое данные неоднородные.

Методы математической статистики должны позволить сделать обоснованные выводы о числовых параметрах и законе распределения генеральной совокупности по ограниченному числу выборок из этой совокупности.

Состав выборок случаен и выводы могут быть ложными. С увеличением объема выборки вероятность правильных выводов растет. Всякому решению, принимаемому при статистической оценке параметров, ставится в соответствие некоторая вероятность, характеризующая степень достоверности принимаемого решения.

Задачи оценки параметров распределения ставятся следующим образом:

Есть СВ Х, характеризуемая функцией F(X, q).

q – параметр, подлежащий оценке.

Делаем m независимых выборок объемом n элементов xij (i – номер выборки, j – номер элемента в выборке).

1 x11, x12, …, x1n X1

2 x21, x22, …, x2n X2

m xm1, xm2, …, xmn Xm

Случайные величины X1, X2,…Xm мы рассматриваем как m независимых СВ, каждая из которых распределена по закону F(X, q).

Всякую однозначную функцию наблюдений над СВ х, с помощью которой судят о значении параметра q, называют – оценкой параметра q.

Выбор оценки, позволяющей получить хорошее приближение к оцениваемому параметру – задача исследования.

Основные свойства оценок

Несмещенность, эффективность и состоятельность.

Оценка параметра q называется несмещенной, если M()=q.

Если – в оценке параметра q имеется систематическая ошибка.

Несмещенность оценки гарантирует отсутствие систематической ошибки в оценке параметра.

Несмещенных оценок может быть несколько.

– несмещенная оценка q.

Разброс параметров или рассеяние величины относительно математического ожидания q характеризует дисперсия D(), D().

Из двух или более несмещенных оценок предпочтение отдается оценке, обладающей меньшим рассеянием относительно оцениваемого параметра.

Оценка называется состоятельной, если она подчиняется закону больших чисел:

На практике не всегда удается удовлетворить одновременно всем трем требованиям.

Оценка математического ожидания по выборке

Теорема 1. Среднее арифметическое по n независимым наблюдениям над СВ x с МО m является несмещенной оценкой этого параметра.

Доказательство: x1,x2,…,xn M(x)=m M(x1)=M(x2)=…=M(xn)=m

Теорема 2. Среднее арифметическое по n независимым наблюдениям над СВ x с МО m и дисперсией D(x)=s2 является состоятельной оценкой МО.

Доказательство: D(x)=s2 D(x1)=D(x2)=…=D(xn)=s2

Теорема 3. Если СВ Х распределена по нормальному закону с параметрами (m,s2), то несмещенная и состоятельная оценка МО m имеет минимальную дисперсию s2/n => является и эффективной.

Оценки дисперсии по выборке

Если случайная выборка состоит из n независимых наблюдений над СВ Х с M(X)=m и D(X)=s2, то выборочная дисперсия не является несмещенной оценкой дисперсии генеральной совокупности.

Несмещенной оценкой D(x) является , .

Легко доказать по формуле Чебышева, что оценки S2 и являются состоятельными оценками дисперсии.

Несмещенная, состоятельная и эффективная оценка дисперсии:

Если МО генеральной совокупности неизвестно, то используют .

Существуют регулярные методы получения оценок параметров генеральной совокупности по данным выборок.