Ошибка выборки.

Статистические характеристики всегда содержат ошибку. Предполагается, что ошибки определения статистических характеристик распределены по нормальному закону. Нормальный закон предполагается, что:

- ошибки не беспредельны;

- чем больше ошибка, тем меньше вероятность ее появления и наоборот;

- появление ошибки более 3 – практически невозможное событие.

Нормальный закон имеет место для генеральной совокупности. Для выборки ограниченного объема используют распределение СТЬЮДЕНТА. Характерно, что с увеличением числа опытов распределение СТЬЮДЕНТА все более приближается к нормальному закону. Так как число измерений в нашем примере всего n=20, то для оценки точности и придется использовать распределение СТЬЮДЕНТА.

Для оценки точности статистических характеристик с использованием распределения СТЬЮДЕНТА составлены специальные таблицы.

Оценим точность значения =41,9, рассчитанного по 20-ти измерениям:

1. Задаемся гарантированной вероятностью, т.е. с какой вероятностью мы можем утверждать, что полученный ответ верен. Гарантированную вероятностью обозначают буквой . По физическому смыслу есть вероятность того, что найденное значение может оказаться в области практически невозможных событий. Вероятность такого события должна быть небольшой. Пусть .

2.Рассчитываем среднее квадратическое отклонение для входа в таблицу по формуле

.

3. Используя специальную таблицу, находи значение коэффициента СТЬЮДЕНТА, который обозначают . Входом в таблицу являются и число степеней свободы =19:

.

Примечание. При отсутствии таблицы можно воспользоваться компьютером. Для этого в Excel выделить любую ячейку, затем последовательно вызвать Статистические функции, СТЬЮДРАСПОБР и в появившемся подменю указать: Вероятность 0,1; Степени свободы 19, ОК. В выделенной ячейке появится число 1,729133 (значение коэффициента СТЬЮДЕНТА).

4. Рассчитывают величину доверительного интервала .

Смысл полученного результата: вероятность того, что мы ошибаемся равна 0,1. С вероятностью 0,9 можно утверждать, что истинное значение mх не выходит за пределы доверительного интервала 41,9±0,6, т.е. находится в пределах 41,3 < mх < 42,5 или на рисунке

Аналогично рассчитывается доверительный интервал для дисперсии, но при этом используется другая таблица и несколько отличная методика.

Ошибка выборки.В теории вероятностей численное значение

называют среднее квадратическое отклонение, а значение

– доверительным интервалом.

В статистике введена другая терминология: – средняя ошибка малой выборки; – предельная ошибка малой выборки.