Задача о надежности определения математического ожидания при заданной точности

1. Пусть объем выборки велик, например . В этом случае, в соответствии с теоремой Ляпунова среднее арифметическое как сумма большого числа случайных величин будет распределено приближенно нормально. Действительно, среднее выборочное можно рассматривать как случайную величину, равную сумме случайных величин. Выборочные значения можно рассматривать как значения одинаково распределенных случайных величин с одним и тем же математическим ожиданием и одной и той же дисперсией (Значения изменяются от выборки к выборке). Найдем математическое ожидание и дисперсию среднего арифметического

. (10)

Найдем дисперсию среднего арифметического

(11)

Следовательно, дисперсия среднего арифметического в раз меньше статистической дисперсии самой случайной величины . Отсюда среднеквадратичное отклонение среднего выборочного равно .

Среднее арифметическое при больших значениях имеет нормальное распределение, Следовательно,

. (12)

где – функция Лапласа, Следовательно, – оценка с точностью и с надежностью , т.е. с вероятностью неизвестное математическое ожидание находится в интервале .

Формулу (12) используют тогда, когда известна дисперсия случайной величины. При больших объемах выборки можно заменить в формуле (12) на .

 

2). Пусть объем выборки невелик (). В этом случае уже нельзя предположить, что среднее арифметическое распределено нормально. Английский статистик Госсет, писавший под псевдонимом Стьюдент, нашел закон распределения случайной величины – центрированного и нормированного среднего арифметического. Плотность этого распределения имеет вид

, (13)

где , число степеней свободы.

Отметим, что в некоторых изданиях плотность распределения обозначается . Распределение Стьюдента зависит только от числа степеней свободы и не зависит от неизвестных параметров . Эта особенность является его большим преимуществом.

Распределение Стьюдента близко к нормальному при больших значениях (практически при ). Пусть задан интервал . Вычислим с помощью распределения Стьюдента. Если , то . Следовательно,

, Здесь было учтено, что является четной функцией. Для функции , где , существуют подробные таблицы. По заданной надежности и объему выборки по таблицам находится значение , отсюда определяется доверительный интервал для математического ожидания

При оценке математического ожидания с помощью среднего арифметического при большом значении часто пользуются правилом , которое позволяет грубо оценить интервал возможных значений математического ожидания .

. Отсюда и следовательно

.

Пример 1. Из очень большой партии деталей отобрано 72 детали. Их средний вес . Дисперсия . С какой вероятностью можно утверждать, что средний вес деталей всей партии не меньше 649 г и не больше 651 г.

Решение. Здесь , , .

Считаем, что распределено нормально. Тогда .

Пример 2. Из очень большой партии цилиндрических деталей отобрано 10 деталей. Измерены диаметры деталей и найдено их среднее арифметическое . Дисперсия .Найти надежность того, что среднее значение диаметров всей партии заключено между 5.96 и 6.08 мм.

Решение. В данном случае объем выборки мал Поэтому нужно использовать распределение Стьюдента.

.

 

2. Задача о точности оценки математического ожидания при заданной надежности

Пусть имеется выборка выборка объема . Величина – среднее арифметическое. Нужно найти такой промежуток , относительно которого с заданной вероятностью можно утверждать, что . Задача решается так же, как и в предыдущем случае. При больших значениях нужно использовать нормальное распределение, а при малых значениях – распределение Стьюдента.

Пример 3. На токарном станке изготовлена большая партия валиков. Измерены отклонения диаметров 16 случайно отобранных из этой партии валиков от середины поля допуска. Среднее значение измеренных отклонений равно 2 мк, статистическая дисперсия , . Найти промежуток , относительно которого можно утверждать с вероятностью , что среднее значение отклонения диаметров валиков всей партии заключено в этом промежутке.

Решение. . Нужно найти . Применим распределение Стьюдента. , Из таблицы значений =0.9 найдем . Учитывая, что , получим . Отсюда . Следовательно, с надежностью 0.9 можно утверждать, что среднее значение отклонения диаметров валиков всей партии от середины поля допуска заключено между 1 мк и 3 мк.

С помощью нормального распределения получим . Отсюда с помощью таблиц функции Лапласа найдем и следовательно .

Надежность 0.9 указывает, что если произведено достаточно большое число выборок, то 90% из них определяет такие доверительные интервалы, в которых параметр действительно заключен и лишь в 10% случаев он может выйти за границы доверительного интервала.