Ошибки выборки

Расхождение между характеристиками выборки и генеральной совокупности составляет ошибку выборки. Она зависит от вариации изучаемого признака, численности выборки, методов отбора единиц в выборку, принятого уровня достоверности результата.

Количество отобранных в выборочную совокупность единиц определяют исходя из принятой доли выборки КВ

КВ =Доля выборки = =.

Например, при КВ = 5% выборки из партии N = 1000 единиц объем выборки n = 50 единиц, а при КВ = 10% – n = 100 единиц.

Различают два вида обобщающих показателей:

· относительную величину альтернативного признака, т.е. долю р (удельный вес)единиц совокупности, обладающих данным значением признака (например, доля нестандартных изделий в партии товара, удельный вес продукции собственного производства в товарообороте общепита, удельный вес продавцов в общей численности);

· среднюю величину количественного признака.

Выборочная доля (), или частость, определяется отношением числа единиц m, обладающих изучаемым признаком, к общему числу выборочной совокупности n.

Например, если из 100 деталей (n = 100) 95 оказались стандартными (m = 95), то выборочная доля .

Для характеристики выборочных показателей используют понятие ошибки выборки.

Ошибка выборки ε (репрезентативности) представляет разность выборочных и генеральных характеристик:

· для средней количественного признака ;

· для доли (альтернативного признака) .

При случайном повторном отборе средние ошибки рассчитываются по формулам:

· для среднего количественного признака ,

· для доли (альтернативного признака) .

Так как , дисперсия признака в генеральной совокупности точно неизвестна, на практике пользуются значением дисперсии , рассчитанным для выборочной совокупности на основании закона больших чисел (выборочная совокупность при достаточно большом объеме выборки достаточно точно воспроизводит характеристики генеральной совокупности). Генеральная дисперсия выражается через выборочную . При достаточно больших n можно принять . Среднее и дисперсия количественного признака в выборке определяется по формулам

.

При случайном повторном отборе формулы средних ошибок примут вид

 

При случайном бесповторном отборе численность генеральной совокупности в ходе выборки сокращается. Формулы для среднего значения количественного признака и для доли имеют вид:

, .

Малые выборки. Под малой выборкой понимается несплошное статистическое обследование с небольшим числом единиц – от 4 до 30. Тогда:

1. Генеральная дисперсия выражается через выборочную по формуле: .

2. Средняя ошибка малой выборки при повторном отборе имеет вид: .

Распространение выборочных результатов на генеральную совокупность производится с учетом закона больших чисел, который определяет с заданной вероятностью предел возможной ошибки различий средних

, , .

где P – вероятность события, указанного в скобках, t – коэффициент доверия, Ф(t) – интеграл нормальной плотности распределения c нулевым средним и единичной дисперсией на отрезке [-t,t]. Функция Ф(t) задается таблицами. Для выборок при n>30 значения t и Ф(t) приведены в таблице.

t 1.960 2.58
Ф(t) 0.683 0.95 0.954 0.99 0.997

Таким образом при заданной вероятности Ф(t) и определяемом из таблицы значении t можно определить предельные значения характеристик генеральной совокупности и их доверительные интервалы:

· для средней величины количественного признака ,

· для доли альтернативного признака ,

Например, при Р = 0,683 ® t = 1. Следовательно в 68,3% случаев ошибка не выйдет за пределы (одной средней ошибки выборки).

Распространение характеристик выборки на генеральную совокупностьпроизводится следующими способами.

Способ прямого расчета состоит в том, что показатели выборочной доли w, или средней распространяются на генеральную совокупность с учетом ошибки выборки (количество поступивших в партии товаров нестандартных изделий, …).

Способ поправочных коэффициентов применяется в случаях, когда целью выборочного метода является уточнение результатов сплошного учета (ежегодная перепись скота у населения, …). Для этого после обобщения данных сплошного учета практикуется 10% выборочное обследование с определением так называемого «процента недоучета».

Пример 1. При проверке качества хлебобулочных изделий проведено 5% выборочное обследование партии батонов. Из 100 отобранных в выборку батонов 90 штук соответствовали требованиям стандарта. Средний вес одного батона 500,5 г при среднем квадратичном отклонении 15,4 г.

Установить возможные значения доли стандартных изделий и среднего веса одного изделия для всей партии товара.

Решение. Значение альтернативного признака m = 90. Число единиц выборки n = 100. Значение альтернативной доли (частости ) определим как .

Средний вес изделия в выборке известен и равен г.

.

Найдем возможные значения ошибки выборки:

– для среднего веса изделия

г;

– для показателя средней доли стандартных изделий

 

;

или от 87,1 до 92,9% удельного веса стандартных изделий в партии.

Средний вес изделий во всей партии

Предельную ошибку выборки определим с вероятностью 0,99. При этом t = 2,6. Доля стандартных изделий во всей партии или от 0,825 до 0,975.

Это значит, что в 99 случаях из 100 удельный вес стандартных изделий во всей партии будет находится в пределах от 82,5 до 97,5%.

Средний вес изделия во всей партии , от 500,5 – 3,9 до 500,5 + 3,9.

С вероятностью равной 0,99 можно утверждать, что средний вес изделия во всей партии находится в пределах от 496,9 до 504,4 г.