Основными числовыми характеристиками выборки являются характеристика положения (среднее значение) и характеристика вариации признака (дисперсия).
Пример 1. 1. Предположим, решили создать мастерскую по пошиву мужской обуви. На какой размер обуви следует ориентироваться. Решили провести статистическое наблюдение: спросили у 20 случайных прохожих мужчин, какой размер обуви они носят. Оказалось
Размер, | ||||||||
Количество, |
Определить среднее значение измеряемой величины и дисперсию при малом числе измерений
Определяем средний размер обуви по формуле
= 41,9.
Находим дисперсию
2,29.
Для прогнозирования необходимо оперировать параметрами генеральной совокупности, а не данными, полученными из случайной выборки. Каковы значения этих характеристик для генеральной совокупности ?
Теоретические положения. В соответствии с законом больших чисел, с увеличением числа измерений числовые характеристики, полученные в результате опыта, все более приближаются к числовым характеристикам генеральной совокупности.
Среднее значение для генеральной совокупности обозначают и называют математическим ожиданием. Вполне возможно, что в данном случае . Но если бы мы опросили других прохожих, то получили бы другое значение , которое, вполне возможно, оказалось бы . Следовательно, не содержит систематической ошибки, т.е. «является несмещенной оценкой». На основании этого среднее значение , полученное по результатам опыта, является подходящей (приемлемой) характеристикой случайных значений .
В теории вероятностей доказано, что в отличии от , дисперсия содержит систематическую ошибку. Систематическую ошибку всегда можно учесть с помощью коэффициента. Введя поправочный коэффициент, формула для определения дисперсии для малой выборки принимает вид .
Следовательно, и .
Таким образом, в статистике принимают
Числовые характеристики | |
выборки | генеральной совокупности |
1.3.2. Оценка надежности значений и .