Оценка параметров нормального распределения

Нередки случаи, когда у нас есть некоторые основания считать интересующую нас СВ распределенной по нормальному закону. Существуют специальные методы проверки такой гипотезы по данным наблюдений, но мы ограничимся напоминанием природы этого распределения – наличия влияния на значение данной величины достаточно большого количества случайных факторов.

Напомним себе также, что у нормального распределения всего два параметра – математическое ожидание m и среднеквадратичное отклонение s.

Пусть мы произвели 40 наблюдений над такой случайной величиной X и эти наблюдения представили в виде:

Таблица 5-2

X_i									Всего
n_i
f _i	0.100	0.075	0.075	0.050	0.100	0.175	0.300	0.125

Если мы усредним значения наблюдений, то формула расчета выборочного среднего

M_x = S X_i· n_i =S X_i · f_i {5–1} будет отличаться от выражения для математического ожидания m только использованием частот вместо вероятностей.

В нашем примере выборочное среднее значение составит M_x = 171.5 , но из этого пока еще нельзя сделать заключение о равенстве m = 171.5.

· Во-первых, M_x– это непрерывная СВ, следовательно, вероятность ее точного равенства чему-нибудь вообще равна нулю.

· Во-вторых, нас настораживает отсутствие ряда значений X.

· В-третьих, частоты наблюдений стремятся к вероятностям при бесконечно большом числе наблюдений, а у нас их только 40. Не мало ли?

Если мы усредним теперь значения квадратов отклонений наблюдений от выборочного среднего, то формула расчета выборочной дисперсии

D_x = (S_x)²= S (X_i– M_x)² · n_i =S (X_i)² · f_i – (M_x)² {5–2} также не будет отличаться от формулы, определяющей дисперсию s².

В нашем примере выборочное значение среднеквадратичного отклонения составит S_x= 45.5 , но это совсем не означает, что s =45.5.

И всё же – как оценить оба параметра распределения или хотя бы один из них по данным наблюдений, т.е. по уже найденным M_xи S_x?

Прикладная статистика дает следующие рекомендации:

· значение дисперсии s²считается неизвестным и решается первый вопрос – достаточно ли число наблюдений N для того, чтобы использовать вместо величины s ее выборочное значение S_x;

· если это так, то решается второй вопрос – как построить нулевую гипотезу о величине математического ожидания m и как ее проверить.

Предположим вначале, что значение s каким–то способом найдено. Тогда формулируется простая нулевая гипотеза Њ₀: m=M_x и осуществляется её проверка с помощью следующего критерия. Вычисляется вспомогательная функция (Z–критерий)

, {5-3} значение и знак которой зависят от выбранного нами предполагаемого m.

Доказано, что значение Z является СВ с математическим ожиданием 0 , дисперсией 1 и имеет нормальное распределение.

Теперь важно правильно построить альтернативную гипотезу Њ₁. Здесь чаще всего применяется два подхода.

Выбор одного из них зависит от того – большое или малое (по модулю) значение Zу нас получилось. Иными словами – как далеко от расчетного M_xмы выбрали гипотетическое m..

· При малых отличиях между M_x и m разумно строить гипотезы в виде

Њ₀:m= M_x;

Њ₁: неизвестное нам значение m лежит в пределах

M_x– ·Z _2k£ m £ M_x+ ·Z _2k {5–4}

Критическое (соответствующее уровню значимости в 5%) значение критерия составляет при этом = 1.96 (двухсторонний критерий). Если оказывается, что выборочное значение критерия ½Z½ < 1.96, то гипотезаЊ₀: m=M_x принимается, данные наблюдений не противоречат ей.

Если же это не так, то мы “в утешение” получаем информацию другого вида – где, на каком интервале находится искомое значение m.

· При больших отличиях (в большую или меньшую сторону) между m и M_xгипотезы строятся иначе Њ₀: m= M_x; Њ₁: неизвестное нам значение m лежит вне пределов, указанных в {5–4}.

Теперь критическое (соответствующее уровню значимости в 5%) значение критерия составляет Z _1k= 1.645 (односторонний критерий). Если оказывается, что выборочное значение критерия½Z½ ³ 1.645, то гипотеза Њ₀: m =M_x отвергается, данные наблюдений противоречат ей.

Если же это не так, то мы получаем информацию другого вида – где, на каком крае интервале находится искомое значение m. Разумеется, для других (не 5%) значений уровня значимости Z_1kи Z _2kявляются другими.

Чуть сложнее путь проверки гипотез о математическом ожидании m в случаях, когда s нам неизвестна и приходится довольствоваться выборочным значением среднеквадратичного отклонения по данным наблюдений.

В этом случае вместо “z –критерия” используется т.н. “t–критерий” или критерий Стьюдента

, {5–5} в котором используется значение “несмещенной” оценки для дисперсии s²

(S_x)²= S (X_i– M_x)² · n_i . {5–6}

Далее используется доказанное в теории положение – случайная величина t имеет специальное распределение Стьюдента с m=N–1 степенями свободы.

Существуют таблицы для этого распределения по которым можно найти вероятность ошибки первого рода или, что более удобно, – граничное значение этой величины при заданных заранее a и m. Таким образом, если вычисленное нами значение ½t½³ t(a,m), то Њ₀ отвергается, если же это не так – Њ₀принимается. Конечно, при большом количестве наблюдений (N>100…120) различие между z– и t–критериями несущественно. Значения критерия Стьюдента для a=0.05 при разных количествах наблюдений составляют:

Таблица 5–3

m
t	12.7	4.30	3.18	2.78	2.57	2.45	2.36	2.31	2.26	2.23	2.09	2.04	2.02	1.98