Условия отбора единиц в выборочную совокупность

1. Каждая единица генеральной совокупности должна иметь равные возможности попасть в выборку.

2. Количество единиц в выборке должно быть достаточно большим.

Основная задача выборочного наблюдения в экономике состоит в том, чтобы на основе характеристик выборочной совокупности (средней и доли) получить достоверное суждение о показателях средней и доли в генеральной совокупности.

При любом статистическом наблюдении возникают ошибки двух видов:

1) ошибки регистрации:

– случайные;

– систематические;

2) ошибки репрезентативности (представительности):

– случайные;

– систематические.

Ошибки репрезентативности присущи только выборочному наблюдению и возникают в силу того, что выборочная совокупность не полно воспроизводит генеральную. Они представляют собой расхождение между значениями показателей, полученных по выборке, и значениями этих величин, которые были бы получены при сплошном наблюдении, т. е. между величиной выборочных и соответствующих генеральных показателей.

Значения ошибки репрезентативности зависят от вида, метода и способа формирования выборочной совокупности.

По виду различают индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности. При групповом отборе – качественно-однородные группы или серии изучаемых единиц. Комбинированный отбор предполагает сочетание первых двух.

По степени охвата единиц совокупности различают большие и малые (когда число отобранных единиц меньше 30) выборки.

Таблица 8.1

Условные обозначения

Показатель	Выборочная совокупность	Генеральная совокупность
Средняя
Дисперсия	σ²	S²
Доля единиц, обладающих признаком	W	p
Численность единиц	n	N

Выборочная доля или частость определяются отношением числа единиц, обладающих изучаемым признаком m, к общему числу единиц выборочной совокупности n:

Выборочная средняя и выборочная доля являются случайными величинами, которые могут принимать различные значения в зависимости от того, какие единицы совокупности попали в выборку. Поэтому ошибки выборки тоже являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок выборки – среднюю ошибку выборки ().

Возможные расхождения между характеристиками генеральной и выборочной совокупностей измеряются средней ошибкой выборки . Она зависит:

– от объема выборки (чем больше численность выборки, тем меньше величина средней ошибки выборки);

– от степени варьирования изучаемого признака (степень варьирования характеризуется дисперсией) – чем меньше вариация признака, тем меньше средняя ошибка выборки.

При нулевой дисперсии (признак не варьирует) средняя ошибка выборки = 0, т. е. любая единица генеральной совокупности будет точно характеризовать всю совокупность по этому признаку.

Учитывая, что дисперсию генеральной совокупности (S²) иногда невозможно или нецелесообразно определить, в практике её заменяют выборочной дисперсией (σ²) с применением специального коэффициента , тогда и средняя ошибка выборки будет вычисляться по формуле (такая замена применяется в случае малой выборки n < 30).

Так как коэффициент К при достаточно больших n – величина близкая к 1

, то можно принять σ² ≈ S², т. е.

(только для больших выборок).

Для среднего значения признака в генеральной совокупности имеем следующую оценку: или , а для доли единиц, обладающих признаком в генеральной совокупности: или .

Но такое суждение можно гарантировать не с абсолютной достоверностью, а лишь с определенной степенью вероятности, равной 0,683.

В математической статистике доказывается, что о величине средней ошибки можно судить с постоянной степенью вероятности 0,683, т. е. из 1000 выборочных обследований в 683 случаях сводные показатели генеральной совокупности будут отличаться от сводных показателей выборочной совокупности не более чем на величину средней ошибки выборки (μ), а в остальных 317 случаях они могут выйти за эти пределы.

Чтобы повысить вероятность суждения, необходимо расширить пределы отклонений выборочной средней от генеральной (и выборочной доли от генеральной) путем увеличения средней ошибки в t раз.

Получаем новую ошибку:

где – предельная ошибка выборки;

t – нормированное отклонение, или «коэффициент доверия», зависящий от вероятности с которой гарантируется предельная ошибка.

Значения вероятности при различных значениях t определяют на основе специально составленных таблиц. Приведем некоторые значения, применяемые наиболее часто для выборок достаточно большого объема, где n :

Таблица 8.2

t		1,5	1,96		2,5	2,580
P - вероятность	0,683	0,866	0,950	0,954	0,988	0,990	0,997

Предельная ошибка выборки позволяет определить предельные значения характеристик генеральной совокупности и их доверительные интервалы.

Интервальная оценка:

или ;

или .

Величина ошибок зависит от способа отбора единиц в выборку.