Выборочное наблюдение

 

Выборочным называется один из видов несплошного наблюдения, при котором характеристика всей совокупности единиц дается по некоторой их части, отобранной в случайном порядке.

Реализация выборочного метода базируется на понятиях генераль­ной и выборочной совокупностей.

Генеральной совокупностью называется вся исходная изучаемая статистическая совокупность, из которой на основе отбора единиц или групп единиц формируется выборочная совокупность. Поэтому генеральную совокупность также называют основой выборки.

При выборочном наблюдении имеют дело с двумя категориями обобщающих показателей: долей и средней величиной.

Доля дает характеристику совокупности по альтернативно варьирующему признаку и исчисляется как отношение числа единиц совокупности, обладающих интересующим нас признаком, к общему числу единиц совокупности. Задача выборочного наблюдения в данном случае состоит в том, чтобы на основе измерения выборочной доли дать правильное представление о доле в генеральной совокупности.

Средняя величина характеризует типичное значение варьирующего признака, вариация которого проявляется в различных количественных значениях у отдельных единиц совокупности. Задача выборочного наблюдения в данном случае заключается в том, чтобы на основе выборочной средней дать правильное представление о генеральной средней.

При рассмотрении теории и методов выборочного наблюдения используются следующие общепринятые услов­ные обозначения:

Таблица 2

Характеристики совокупности Совокупность
Генеральная Выборочная
Объем совокупности (число единиц) N n
  Число единиц совокупности, обладающих изучаемым признаком M m
Средняя величина х
Доля   (частость)

 

При выборочном наблюдении, как и при любом другом, возможно возникновение ошибок, которые можно разделить на ошибки регистрации и ошибки репрезентативности, систематические и случайные.

Ошибки регистрации являются следствием неправильного уста­новления значения наблюдаемого признака или неправильной запи­си. Они свойственны не только выборочному, но и сплошному на­блюдению.

Ошибки репрезентативности (ошибки выборки) обусловлены тем, что выборочная совокупность не может по всем параметрам в точности воспроизвес­ти генеральную совокупность. Получаемые расхождения называют­ся ошибками репрезентативности, или представительности, так как они отражают, в какой степени попавшие в выборку единицы могут представлять всю генеральную совокупность. При этом следует раз­личать систематические и случайные ошибки репрезентативности.

Систематические ошибки репрезентативности связаны с нару­шением принципов формирования выборочной совокупности. Напри­мер, вследствие каких-либо причин, связанных с организацией отбо­ра, в выборку попали единицы, характеризующиеся несколько большими или, наоборот, несколько меньшими по сравнению с дру­гими единицами значениями наблюдаемых признаков. В этом случае и рассчитанные выборочные характеристики будут завышенными или заниженными.

Случайные ошибки репрезентативности обусловлены действием случайных факторов, не содержащих каких-либо элементов систем­ности в направлении воздействия на рассчитываемые выборочные характеристики. Но даже при строгом соблюдении всех принципов формирования выборочной совокупности выборочные и генеральные характеристики будут несколько различаться. Получаемые случайные ошибки могут быть статистически оценены и учтены при распрост­ранении результатов выборочного наблюдения на всю генеральную совокупность. Оценка ошибок выборочного наблюдения основана на теории вероятностей.

Таким образом, ошибка выборки свойственна только выборочным наблюдениям, и чем больше величина этой ошибки, тем в большей степени сводные показатели выборочной совокупности отличаются от сводных показателей генеральной совокупности.

Зависимость величины ошибки выборки от ее численности и от степени варьирования признака находит выражение в формулах средней ошибки выборки – среднем отклонении характеристик выборочной совокупности от аналогичных характеристик генеральной совокупности:

Средняя ошибка выборочной средней: .

Средняя ошибка выборочной доли: .

 

Однако то, что генеральная средняя или генеральная доля не выйдет за определенные пределы, можно утверждать не с абсолютной достоверностью, а лишь с определенной степенью вероятности, для чего рассчитывается предельная ошибка выборки:

,

где t – коэффициент доверия (коэффициент кратности ошибки), зависящий от вероятности, с которой можно гарантировать, что предельная ошибка не превысит t-кратную среднюю ошибку. Коэффициент доверия t определяется по таблице распределения вероятностей (например, вероятности р = 0,683 соответствует t = 1; вероятности р = 0,954 соответствует t = 2; вероятности р = 0,997 соответствует t = 3).

Распространение показателей выборочной совокупности на генеральную совокупность.

После исчисления предельных ошибок выборки находят доверительные интервалы для генеральных показателей, т.е. границы, в которых будут находиться значения изучаемых характеристик в генеральной совокупности.

Для генеральной средней пределы устанавливаются с учетом предельной ошибки выборочной средней:

или

Для генеральной доли пределы устанавливаются с учетом предельной ошибки выборочной доли:

или

 

Отбор единиц в выборочную совокупность может быть повтор­ным или бесповторным.

При повторном отборе попавшая в выборку единица подверга­ется обследованию, т.е. регистрации значений ее признаков, возвра­щается в генеральную совокупность и наравне с другими единицами участвует в дальнейшей процедуре отбора. Таким образом, некоторые единицы могут попадать в выборку дважды, трижды или даже боль­шее число раз. И при изучении выборочной совокупности они будут рассматриваться как отдельные независимые наблюдения.

Отметим, что число единиц генеральной совокупности, участву­ющих в отборе, при таком подходе остается постоянным. Поэтому вероятность попадания в выборку для всех единиц совокупности на протяжении всего процесса отбора также не меняется.

На практике методология повторного отбора обычно используется в тех случаях, когда объем генеральной совокупности не известен и теоретически возможно повторение единиц с уже встречавшимися значениями всех регистрируемых признаков.

При бесповторном отборе попавшая в выборку единица подвер­гается обследованию и в дальнейшей процедуре отбора не участвует. Такой отбор целесообразен и практически возможен в тех случаях, когда объем генеральной совокупности четко определен. Получаемые при этом результаты, как правило, являются более точными по срав­нению с результатами, основанными на повторной выборке (ошибка выборки при бесповторном отборе всегда будет меньше, чем при повторном отборе).

Таким образом, при бесповторной выборке численность единиц генеральной совокупности в процессе отбора сокращается, и при определении ошибки выборки формула корректируется на долю отобранных единиц в генеральной совокупности (n / N):

(для средней)

 

(для доли)

Нерайонированный отбор – отбор из всей генеральной совокупности, не разделенной на части.

Районированный отбор – единицы в выборочную совокупность отбираются не из всей генеральной совокупности, а из отдельных ее частей (групп), на которые она предварительно разбивается. Разбивка генеральной совокупности на группы часто осуществляется по реально существующему разделению совокупности на отдельные части (например, разделение студентов института по факультетам, работников предприятия по цехам), но иногда специально образуют группы по признакам, влияющим на вариацию изучаемых показателей (выделяют типы). Такой отбор называется типическим.

Собственно-случайный отбор – бесповторная нерайонированная выборка, при которой каждая единица совокупности имеет равную возможность попасть в выборочную совокупность (лотерея, жеребьевка).

Механический отбор – районированный или нерайонированный отбор единиц из генеральной совокупности по списку, не влияющему на результаты выборки, при котором отбирается каждая i-я единица совокупности: .

Серийная выборка – производится случайный отбор не отдельных единиц совокупности, а целых серий. Внутри отобранных серий сплошное обследование всех единиц. Ошибка выборки при серийном отборе определяется на основе межсерийной (межгрупповой) дисперсии (d2):

Для средней –

(повторный отбор)

(бесповторный отбор)

 

Для доли -

(повторный отбор)

(бесповторный отбор)

где r – число отобранных серий;

R – число серий в генеральной совокупности;

- межсерийная дисперсия средних;

- межсерийная дисперсия доли.

Межсерийная дисперсия определяется по формулам:

для средней - ,

 

для доли - .

Таблица 3