Способы образования выборочной совокупности.

Собственно случайный отбор – отбор в совершенно случайном порядке (жеребьевка).

Может быть осуществлен в двух видах:

ü повторный отбор – отобранная для наблюдения единица регистрируется и возвращается в исходную совокупность, таким образом, возникает возможность отобрать для наблюдения данную единицу еще раз. Вероятность отбора у всех единиц одинакова.

ü бесповторный отбор – отобранная для наблюдения единица регистрируется и не возвращается в исходную совокупность. Таким образом, единица для наблюдения может быть отобрана только один раз, а вероятность отбора последующих единиц увеличивается.

Механический отбор – отбор единиц в выборочную совокупность производится из генеральной совокупности через равные интервалы (так сказать, механическим путем). При этом все единицы генеральной совокупности должны быть упорядочены по какому-либо признаку: существенному, второстепенному или нейтральному. Далее, генеральная совокупность делится на столько групп, сколько единиц необходимо отобрать в выборочную совокупность. В первой группе случайным образом отбирается первая единица для наблюдения. А затем во всех последующих группах отбираются единицы с этим же порядковым номером. Таким образом, механическая выборка по принципу своей организации бывает только бесповторной.

Типический отбор – генеральная совокупность предварительно разбивается на однородные по какому-либо признаку (типу) группы. Далее, из каждой группы отбираются единицы в выборочную совокупность либо в собственно случайном порядке (повторно или бесповторно), либо механически.

Отбор в группах осуществляется независимо, т. е. каждая группа рассматривается как отдельная совокупность. Общим соблюдается лишь способ отбора. Данный способ применяется при изучении сложных явлений, например, при исследовании производительности труда работников, разбитых на группы по квалификации. Отбор единиц в выборочную совокупность может проводиться повторным и бесповторным способом.

Серийный (гнездовой) отбор – генеральная совокупность разбивается на серии (гнезда) и для наблюдения отбираются не отдельные единицы, а целые серии (гнёзда), внутри которых единицы обследуются сплошным способом (например, товар упакован в коробки, т. е. серия – коробка). Отбор серий производится либо в собственно случайном, либо в механическом порядке.

На практике эти способы обычно применяются не в «чистом» виде, а комбинируются в различных сочетаниях (например, серийный отбор со случайной выборкой), так как отбор единиц из генеральной совокупности в действительности – сложный процесс.

8.2. Генеральная и выборочная совокупность,
их обобщающие характеристики.
Репрезентативность выборки

Итак, генеральная совокупность – это, с одной стороны, исходная совокупность, из которой производится отбор единиц для наблюдения, а с другой – совокупность, свойства которой стремятся определить по результатам выборочного наблюдения.

Выборочная совокупность – та часть единиц совокупности, которая отбирается для статистического наблюдения.

Основная задача выборочного наблюдения – получить представление о показателях генеральной совокупности на основе изучения выборочной совокупности.

В выборочном наблюдении применяются 2 обобщающих показателя:

ü среднее значение признака,

ü доля альтернативного признака.

Среднее значение признака – это обобщающая характеристика изучаемой совокупности по количественно варьирующему признаку (например, средняя заработная плата одного работника).

Доля альтернативного признака дает характеристику совокупности по альтернативно варьирующему признаку и исчисляется как отношение количества единиц совокупности, обладающих интересующим значением признака, к общему количеству единиц совокупности (относительная величина структуры). Например, при обследовании студентов определяется доля студентов, получающих стипендию.

Альтернативно варьирующий признак – это признак, имеющий всего два значения: да, нет (например, пол: мужской, женский). Любую множественную вариацию можно свести к альтернативной: интересует значение признака или нет.

В генеральной совокупности среднее значение признака будем называть генеральной средней (), а долю единиц, обладающих интересующим значением признака, – генеральной долей (p).

В выборочной совокупности среднее значение признака будем называть выборочной средней (), а долю единиц, обладающих интересующим значением признака, – выборочной долей ().

Задача выборочного наблюдения – получить достоверное представление о генеральных показателях доли и средней на основе аналогичных характеристик выборочной совокупности. А так как единицы в выборочную совокупность отбираются в случайном порядке, то между выборочными и генеральными показателями всегда существуют расхождения – ошибки выборки или ошибки репрезентативности. Математически это можно выразить следующим образом:

ü для средней –

(1)

ü для доли –

(2)

8.3. Средняя и предельная ошибки
выборочной средней и выборочной доли

Ошибка выборки (ошибка репрезентативности) зависит от численности выборки и от степени варьирования изучаемого признака. Все возможные расхождения между характеристиками выборочной и генеральной совокупности аккумулируются в формуле средней ошибки выборки. Она рассчитывается по-разному в зависимости от способа отбора: повторный или бесповторный.

– Средняя ошибка выборки (m – мю) при повторном отборе.

ü для средней –

(3)

где n – количество единиц выборочной совокупности, – дисперсия варьирующего признака в выборочной совокупности:

· в форме простой для индивидуальных данных

(4)

· в форме взвешенной для сгруппированных данных

(5)

ü для доли –

(6)

где – доля интересующего значения признака в выборочной совокупности:

(7)

и n_да – количество единиц в выборочной совокупности, обладающих интересующим признаком, n – общее количество единиц в выборочной совокупности, – дисперсия альтернативного признака.

– Средняя ошибка выборки при бесповторном отборе.

При этом способе отбора количество единиц генеральной совокупности сокращается в процессе выборки и вероятность отбора каждой последующей единицы увеличивается, что математически отображается в выражении

(), (8)

где N – количество единиц в генеральной совокупности.

Поэтому средняя ошибка выборки при бесповторном отборе

ü для средней –

(9)

ü для доли –

(10)

Приведённые формулы (3), (6), (9), (10) позволяют определить среднюю величину отклонений характеристик генеральной совокупности от выборочных характеристик, равную . Например, по выборочным данным средний срок горения лампочек составляет 3000 часов, а = 50 часов. Следовательно, во всей партии лампочки будут гореть (3000 ± 50) часов, т. е. от 2950 до 3050 часов.

Доказано, что генеральные характеристики отклоняются от выборочных на величину ±μ с вероятностью, равной 0,638. Это означает, что в 683 случаях из 1000 генеральная характеристика будет находиться в пределах ±μ от выборочной характеристики, а в 317 случаях выйдет за эти пределы.

Вероятность суждений можно изменить и, следовательно, изменить границы характеристик генеральной совокупности, если скорректировать среднюю ошибку выборки на коэффициент доверия (t), который зависит от вероятности, с которой можно гарантировать, что предельная ошибка не превысит t-кратную среднюю ошибку. Данный показатель находится по готовым таблицам функции F(t), определённой русским математиком А.М. Ляпуновым применительно к нормальному распределению.

Величина, полученная как произведение коэффициента доверия и средней ошибки выборки, называется предельной ошибкой выборки (D – дельта)

ü для средней:

(11)

ü для доли:

(12)

8.4. Определение необходимой
численности выборки

Размер ошибки выборки прежде всего зависит от количества единиц в выборочной совокупности (численности выборки). Средняя ошибка выборки обратно пропорциональна , т. е. при увеличении численности выборки в 4 раза её ошибки уменьшаются вдвое.

Увеличивая количество единиц в выборочной совокупности, можно довести её ошибку до очень малых размеров, однако надо помнить, что задача выборочного наблюдения – получение необходимой информации с минимальными затратами. Следовательно, надо находить в каждом случае оптимальную численность выборки. Определение необходимой численности выборки основывается на формуле предельной ошибки выборки.

При повторном отборе:

ü для средней предельная ошибка выборки рассчитывается по формуле

(13)

тогда необходимая численность выборки

(14)

ü для доли предельная ошибка выборки рассчитывается по формуле

(15)

тогда необходимая численность выборки

(16)

При бесповторном отборе:

ü для средней предельная ошибка выборки рассчитывается по формуле

(17)

тогда необходимая численность выборки

(18)

ü для доли предельная ошибка выборки рассчитывается по формуле

(19)

тогда необходимая численность выборки

(20)

Примечание: для определения необходимой численности выборки при исследовании конкретного явления в указанных формулах применяют генеральную дисперсию и генеральную долю, т. е. используют показатели, рассчитанные при изучении исходной совокупности.