Формули для розрахунку обсягу простої випадкової вибірки

Відбір за якісною ознакою	Відбір за кількісною ознакою
безповторний	повторний	безповторний	повторний
n = 4Npq / 0,0025N+4pq	n = 4pq / 0,0025	n = 4s² N / 0,0025N+4 s²	n = 4s² / 0,0025
n – обсяг вибіркової сукупності, N – обсяг генеральної сукупності, р – доля одиниць з даним значенням ознаки, q = 1–р – доля одиниць, в яких дана ознака відсутня, s²– дисперсія (характеристика розподілення кількісних ознак)

Якщо для характеристики розподілення кількісних ознак застосовується показник дисперсії, то для якісних ознак це величина pq. Наприклад, обсяг вибірки складає 900 осіб, з них 400 - чоловіки, 500 – жінки:

pq = 400/900 Х (1 – 400/900) » 0,45 Х 0,55 » 0,25

Під час повторного відбору вилучені з сукупності одиниці знов повертаються у сукупність та можуть бути відібраними. Це дозволяє зберегти рівну ймовірність влучення у вибірку всіх одиниць сукупності протягом відбору. У практиці соціальних досліджень, як правило, застосовується безповторний відбір, але для розрахунку характеристик простої випадкової вибірки можна скористатися більш простими формулами для повторного відбору.

Процедура вилучення одиниць може здійснюватися із застосуванням лототрона, а також за допомогою таблиці випадкових чисел. Такі таблиці містять велику кількість випадкових чисел обсягом від декількох десятків до мільйону цифр, які можуть бути двох -, трьох -, чотирьох -, п’яти -, шестизначними. Якщо генеральна сукупність, наприклад, складає 2000 осіб, числа, які ми відбиратиме з таблиці, не повинні перевищувати цього значення. В даному випадку нам підійдуть будь-які числа від 1 до 2000. Якщо у таблиці містяться, наприклад, п’ятизначні числа, в нашому випадку використовуються тільки чотири цифри кожного числа (скажімо, перші чотири). При цьому числа, більші за 2000 чи ті, що нам вже зустрілися, слід пропускати. Пересуватися по таблиці можна з будь-якого її місця, вдовж строки чи стовпця.

Якщо список одиниць має електронний аналог (зберігається у пам’яті комп’ютеру), то процедура відбору здійснюється за допомогою генератору випадкових чисел.

Систематичну вибірку часто розглядають як різновид випадкового відбору, хоча вона реалізується дещо іншим способом. Відбір одиниць із списку (основи вибірки) здійснюється через певний інтервал - крок. Запорука надійності інформації, яку ми отримуємо за допомогою систематичної вибірки, в тому, що порядок розташування одиниць у списку не повинен збігатися із періодичністю у значеннях певної характеристики (наприклад, крок відбору з списку працівників установи дорівнює 20, в той час як кожен 20-й у списку – керівник відділу).

Крок вибірки найчастіше розраховується так:

P = N/n,

де N - обсяг генеральної сукупності, n - обсяг вибірки.

Номер першої одиниці, яка ввійде до ВС, можна визначити випадковим способом (одиниця вибирається із сукупності цифр, що вкладаються у крок) чи наступним чином:

n₁= р/2,

де n₁– номер першого респондента, р – крок вибірки.

Коли об’єкт дослідження чи генеральна сукупність є достатньо великими (наприклад, молодь України, молоді сім’ї міста і т.п.), процес конструювання вибірки протікає в декілька стадій, а вибірка має характер багатоступеневої.

Необхідність застосування багатоступеневої вибірки пов’язана з тим, що іноді неможливо чи недоцільно з точки зору трудомісткості та ресурсозатратності скласти повний список одиниць генеральної сукупності. В даному випадку на початковому та кожному проміжному етапі відбираються об'єкти репрезентації (одиниці відбору), а лише на заключному - одиниці спостереження, наприклад, область – район – мікрорайон – квартал – дім – квартира – сім’я. Багатоступенева вибірка позбавляє нас необхідності збирання інформації щодо всіх без виключення одиниць спостереження, що входять до генеральної сукупності. До того ж, як правило, відомою є інформація щодо основних ознак об’єктів репрезентації на кожному з етапів (ними можуть бути географічні регіони, політико-адміністративні одиниці, підприємства, установи, навчальні заклади).

Основний недолік багатоступеневої вибірки пов’язаний з тим, що кожний етап вносить свій “вклад” у помилку вибірки, тобто чим більшою є кількість етапів, тим більшою буде величина погрішності, яка не підлягає корекції. Наприклад, якщо генеральна сукупність складається з мешканців регіону, необхідно розділити її на таки групи одиниць, які повністю відтворюють її неоднорідність, тобто не забути, наприклад, про мешканців сіл чи малих міст.

Як правило, на першому етапі побудови багатоступеневої вибірки застосовують процедуру стратифікації генеральної сукупності. Страти– це внутрішньо однорідні та відмінні одна від одної частини сукупності, які її повністю вичерпують. Наприклад, територія України поділяється на політико-адміністративні райони, кожен з них - на населені пункти міського і сільського типів, міста розділяються за величиною, територія міст поділена на райони і т.д. Саме таким чином, тобто за територіальною локалізацією респондентів, здійснюється первинна стратифікація у більшості крупномасштабних досліджень з молодіжної проблематики (звідси й інша назва цієї процедури – районування).

Стратифікацію доречно продовжувати, доки не буде досягнуто певної рівномірності розподілу ознаки усередині кожної із страт: наприклад, сукупність "міста України" є неоднорідною за рядом критеріїв, насамперед, за величиною міст, тому її доцільно стратифікувати за критерієм величина (кількість населення): великі міста - середні міста - малі міста. Усередині отриманих страт однорідність розглянутої ознаки буде більшою, ніж між стратами; наприклад, великі міста несхожі з малими, але водночас схожі між собою.

Фактично стратифікація є процедурою формування декількох окремих випадкових підвибірок із певної сукупності, які потім об’єднуються у одну. Чисельність одиниць, які відбираються з кожної страти, можна визначити декількома способами.

1. З кожної страти відбирається та чисельність одиниць, яка пропорційна обсягу страти:

n_i = n N_i /N,

де n – обсяг вибірки, N – обсяг генеральної сукупності, N_i – обсяг і-й страти.

Наприклад, якщо кількість сімей у області дорівнює 1,16 млн.(генеральна сукупність), з них 244,76 тис. - молоді сім’ї, обсяг вибірки – 1000 одиниць, то кількість осіб, які відбиратимуться з страти “молоді сім’ї”, дорівнюватиме 211.

2. Чисельність одиниць у кожній підвибірці пропорційна середньоквадратичному відхиленню s_i у і-й страті (цей показник розраховується за результатами пробного дослідження):

n_i = n N_i s_i / S N_js_j,

^J=1

де n – обсяг вибірки, N_i – обсяг і-й страти, l – кількість груп.

3. З кожної страти відбирається однакова кількість одиниць:

N₁= N₂ = N₃ = ....= N_k

В даному випадку ігнорується розбіжність у чисельності різних страт генеральної сукупності, але водночас з’являється можливість представити у вибірці достатнім чином малочисельні страти.

Якщо на певному етапі стратифікації досягнута однорідність у розподіленні цікавої для дослідника ознаки, як правило, здійснюється процедура виділення гнізд, чи серій (серійна вибірка). На відміну від страт, гнізда є схожими між собою, тобто порівняно однорідними за певною ознакою утвореннями. Нехай генеральну сукупність складають школи міста та в цій сукупності були виділені різні страти, скажімо, державні та приватні навчальні заклади. Всередині кожної з страт досягнута однорідність розподілення ознаки – форма власності освітнього закладу; це означає, що в кожній з страт знаходитимуться порівняно схожі об’єкти – гнізда. На цьому етапі слід відібрати, наприклад, по одному гнізду з кожної страти. На наступному етапі робиться відбір шкільних класів (які теж виступатимуть гніздами, якщо принцип комплектування класів є однаковим) для подальшого обстеження.

Як правило, серіями вважають сім’ї, бригади на підприємствах (якщо вони є схожими між собою за певною значимою ознакою, скажімо, за умовами праці), поштові відділення і т.д. Відібрані у вибірку серії підлягають суцільному чи вибірковому обстеженню [37, с.216]. Треба відзначити, що за умови суцільного обстеження відібраних гнізд однорідність об’єктів всередині кожного з них занадто занижує дисперсію ознаки порівняно з генеральною сукупністю (наприклад, учні конкретного шкільного класу чи працівники певного колективу та, тим більш, члени однієї сім’ї, матимуть багато спільних рис).

Зробити відбір певного гнізда (серії) із страти можна наступними способами:

- за випадковим принципом,

- за принципом типовості гнізда; зокрема, на типовість гнізда можуть вказати експерти; для цього, як правило, опитують трьох експертів, та якщо їхні думки відразу ж сходяться, виділяють для обстеження зазначене ними гніздо, якщо ні – кількість експертів збільшується [34, с.111]

На останньому етапі реалізації власне випадкового чи систематичного відбору перед інтерв’юером, як правило, постає завдання відбору конкретного респондента з кола потенційно можливих. Як правило, на цьому етапі застосовується так званий маршрутний метод. Якщо відбір респондентів здійснюється за допомогою покрокової вибірки, на основі карт місцевості розробляється схема маршруту опитування, в яку заносяться всі житлові будівлі (крім готелів, житлових церковних споруд і т.і.), що зустрічаються на цьому маршруті. У вибірку потрапляє, скажімо, кожна третя будівля (якщо крок дорівнює трьом). Якщо на шляху інтерв’юера зустрічаються багатоквартирні будівлі, то для визначення номеру квартири, як правило, кількість квартир у будинку ділиться на крок вибірки (якщо кількість під’їздів не перевищує трьох); якщо ж кількість під’їздів понад три, кожний під’їзд розглядається як окрема будівля. Якщо опитування за відібраною адресою здійснити немає можливості, відбирається наступна за порядком, але крок при цьому не зміщується.

Для відбору респондента з сім’ї складається повний перелік її членів (за виключенням тих, хто за своїми характеристиками не входить до об’єкту дослідження, наприклад, неповнолітніх). Спочатку переписуються всі особи чоловічої статі у порядку збільшення віку, потім у такому ж порядку – жінки. Із складеного списку відбирається один респондент випадковим чином. Для цього інтерв’юеру видається спеціальна таблиця, зразок якої наводиться нижче (див. таблицю 5).

Таблиця 5