Построение доверительного интервала для математического ожидания нормально распределенной СВ при известном σ.

.

Ранее было показано, что имеет нормальное распределение с параметрами М( )= , D( )= .

Составим стандартизованную СВ:

 

u имеет нормальное распределение с параметрами N(0;1).

Поскольку вероятность любого отклонения – может быть вычислена по формуле:

 

Задавая определенную доверительную вероятность р, мы получим, что , ( ).

Пользуясь таблицей значений функции Лапласа, из равенства найдем р→ . Тогда доверительный интервал для значений определяется из неравенства:

 

 

 

 

 

 

- предельная ошибка выборки. Эта оценка называется классической.

Из формулы следует:

1) При увеличении объема выборки точность оценки увеличивается, т.е. уменьшается;

2) Увеличение доверительной вероятности р ведет к возрастанию , т.к. функция является возрастающей;

3) Если требуется оценить математическое ожидание с наперед заданной точностью δ и надежностью р, то min объем выборки, который обеспечит эту точность, находится по формуле:

 

Рассмотрим формулы, относящиеся к построению доверительного интервала, когда дисперсия генеральной совокупности неизвестна. В качестве точечной оценки берется исправленная дисперсия

- предельная ошибка выборки. Для выборок n >30 строится по формуле:

(для повторной выборки)

, где N – объем всей исследуемой генеральной совокупности; t определяется из равенства:

 

Если n≤30, то доверительный интервал строится только для нормальной генеральной совокупности:

(для повторной выборки), где определяется из условия:

имеет распределение Стьюдента с n-1 степенями свободы.

определяется по таблице значений распределения Стьюдента по р и числу степеней свободы n-1.

Если выборка бесповторная, то:

 

При решении статистических задач часто требуется определить необходимый объем выборки для достижения требуемой доверительной вероятности. Объем выборки n определяется по доверительной вероятности р и предельной ошибке выборки :

для повторной выборки

для бесповторной выборки

 

 

Проверка статистических гипотез

 

Статистической называется гипотеза о виде предполагаемого закона распределения СВ или о значениях параметров распределения, если вид распределения известен. Вместе с выдвинутой гипотезой, которую обозначают Н0 и называют основной (нулевой), рассматривается и противоречащая ей гипотеза, которая обозначается Н1 и называется альтернативной(конкурирующей). Гипотеза может быть простой либо сложной. Для основной гипотезы, конкурирующая задается неоднозначно. В зависимости от вида конкурирующей гипотезы по-разному строится статистическая проверка основной гипотезы.

Гипотезы о виде предполагаемого закона распределения являются непараметрическими, а о значениях параметров известного закона распределения – параметрическими.

Н0: М(Х)=5 Н0 : М(Х)=3

Н0 (2): М(Х)>5

Н0(3) : М(Х)<5

Н0 (4): М(Х)≠5; М(Х)=3

 

Для статической проверки гипотезы используется СВ К , определяемая по выборке. К называется статическим критерием. Значение критерия К, полученное по выборке , называется наблюдаемым значением критерия. Возможные значения критерия разбивают на два непересекающихся класса: к одному из них относят те значения критерия, при которых нулевая гипотеза отвергается (критическая область), к другому – те значения, при которых нулевая гипотеза принимается (область принятия гипотезы). При статистической проверке гипотез можно совершить ошибки первого и второго рода. Ошибка первого рода состоит в отбрасывании нулевой гипотезы Н0 в случае, когда она верна, а ошибка второго рода состоит в принятии гипотезы Н0, когда она на самом деле ошибочна (а верна альтернативная гипотеза Н1).

Критическая область может быть одно- и двусторонняя:

 

 

Критическая область определяется альтернативной гипотезы Н1.

Замечание: Поэтому при проверке статической гипотезы особое внимание необходимо уделять виду альтернативной гипотезы Н1 (и в зависимости от вида альтернативной гипотезы Н1 по-разному проводится проверка нулевой гипотезы Н0).

Н0: m=2

Н1: m<2

Н1’: m>2

 

 

Непараметрические гипотезы (о виде закона распределения СВ)

Критерий Пирсона

 

Пусть количественный признак Х принимает некоторое множество различных значений. Выдвигается гипотеза о виде закона распределения этой СВ F(x):

F(x)=p(X<x)

Всю область изменения СВ Х разбиваем на интервалов:∆1, ∆2,…, ∆ и проведя выборку подсчитываем количество элементов , попавших в каждый интервал mi, i= . Т.к. F(x) известно, то можно найти вероятность pi попадания СВ Х в каждый из интервалов ∆i.

 

mi’= npi

Х 1 2
mi m1 m2 mL
mi np1 np2 npL

 


Замечание: Если теоретические частоты сильно отличаются от эмпирических, то выдвинутую гипотезу сразу можно отбросить.

Сформулируем критерий, который бы характеризовал степень расхождения между эмпирическими и теоретическими частотами. Если проверяемая гипотеза Н0 верна, то СВ mi, характеризующая количество попаданий в интервал ∆i для i= , подчиняется биномиальному закону распределения с М=npi и D=npiqi.

При увеличении объема выборки СВ yi= имеет нормальное распределение с М=0 и D=1. Известно, что при n→∞ СВ имеет распределение Пирсона с К= степенями свободы. Но если параметрическое распределение функции F(x) определяется по выборке, то число степеней свободы с, r – число параметров, определяемых по выборке. В частности, если распределение нормальное, то r=2, K= .

Правило применения критерия : по выборке вычисляют . По уравнению значимости α = и числу степеней свободы К= по таблицам значений критерия вычисляется . Если , то нулевая гипотеза отвергается (результаты выборки не согласовываются с выдвинутой гипотезой ). Если , то нулевая гипотеза принимается (нет оснований отвергать нулевую гипотезу).

Замечание: необходимое условие применения критерия : в каждом интервале должно находиться не менее 5 значений, т.е. mi ≥ 5. Интервалы, в которые попало меньше 5 значений, присоединяются к соседним.

 

 

Проверка гипотезы о равенстве математических ожиданий двух нормально-распределенных генеральных совокупностей при известном σ.

 

Эта проверка имеет имеет важное практическое значение. Иногда оказывается, что средний результат одной серии экспериментов заметно отличается от среднего результата другой серии. При этом возникает вопрос, можно ли объяснить обнаруженные расхождения средних случайных ошибок эксперимента или они вызваны какими-либо незамеченными или неизвестными закономерностями.

Например, в промышленности задача сравнения средних частот возникает при выборочном контроле качества изготовленных изделий на разных установках или при разных технологиях.

Пусть имеются две СВ: Х и У. Производятся выборки объемами n1 и n2. Каждая из этих СВ подчиняется нормальному закону распределения. Предполагаем, что σх2 и σу2 известны. Выдвигается Н0, что М(Х)=М(У). При альтернативной гипотезе Н1 : М(Х)≠М(У).

Н1:

Рассмотрим случай, когда в качестве точечных оценок для М(Х) выбирается , а для М(У) - . Тогда и имеют нормальное распределение с параметрами :

 

 

 

Выборки независимы, поэтому и СВ и также независимы. Причем разность будет иметь нормальное распределение и

 

 

Если гипотеза Н0 справедлива, то . Тогда нормированная разность ,будет иметь нормальное распределение с параметрами (0;1).

Выбираем (в соответствии с вероятностью задачи = α) по таблице приложений критическое значение критерия , которое разделит множество z на две области. Допустимая область определяется:

, т.е. имеем двустороннюю критическую область.

 

.

 

 

Проверка гипотезы о равенстве математических ожиданий двух нормально-распределенных генеральных совокупностей при неизвестном σ.

 

σх2 и σу2 – неизвестны. σх2 = σу22.

Пусть имеем две независимые выборки с объемом n1 и n2.

Н0: М(Х)=М(У).

Н1: .

Для оценки математического ожидания и дисперсии воспользуемся выборочной средней и исправленной дисперсией.

 

 

Т.к. мы предполагаем, что σх2 = σу22, то для оценки σ2 целесообразно использовать результаты обеих выборок и в качестве такой оценки используется оценка .

Если гипотеза Н0 верна, то СВ подчиняется нормальному закону распределения с М( )=0 и D(

Доказательство:

М( )= (в силу гипотезы Н0)

D(

Но по условию неизвестно, поэтому для необходимо выбирать точечную оценку. В качестве выборочной оценки для D( обычно принимают оценку .

Т.к.

 

 

является несмещенной оценкой для дисперсии D( .

Известно, что если СВ (в данном случае ( ) подчиняется нормальному закону распределения, то статистика

 

имеет t-распределение (распределение Стьюдента) с

степенями свободы. Если гипотеза Н0 справедлива, то t можно записать в виде:

 

Выбрав доверительную вероятность р=1-α, по таблице t-распределения определяем критическое значение tn1+n2-2,α=tкрит (двусторонняя область из условия ).

Если вычисленное значение t=tнабл и tнабл, то с надежностью р=1-α можно утверждать, что расхождения между средними значениями существенно, т.е. Н0 отвергается.

 

 

Проверка гипотезы о равенстве двух дисперсий

 

Гипотезу о равенстве двух дисперсий проверяют при сравнении точности работы машин и приборов, технологических процессов и т.д. Пусть имеются две выборки объемом n1 и n2, взятые из генеральной совокупности с нормальным распределением. Предположим, что найдены исправленные дисперсии . Проверяется гипотеза Н0: D(Х)=D(У)= σ2. Проверку этой гипотезы выполняют по критерию:

 

 

СВ F имеет распределение Фишера (F-распределение) с К1=n1-1 и К2=n2-1 степенями свободы. Выбрав α(р=1-α) определяют по таблице F-распределения Fкрит= Fk1,k2,α. Если F>Fкрит, то Н0 отвергается. Если F≤Fкрит, то Н0 принимается.