Основні поняття та категорії

Вибірковий метод — це система наукових принципів випадкового відбору певної частини сукупності, яка представляла б усю сукупність і характеристики якої слугували б надійною основою статистичного висновку.

Сукупність, з якої відбираються елементи для обстеження, називають генеральною, а сукупність, яку безпосередньо обстежують, — вибірковою. Статистичні характеристики вибіркової сукупності розглядаються як оцінки відповідних характеристик генеральної сукупності. Оскільки вибіркова сукупність не точно відтворює структуру генеральної, то вибіркові оцінки також не збігаються з характеристиками генеральної сукупності. Розбіжності між ними називають похибками репрезентативності. За причинами виникнення ці похибки поділяються на систематичні (тенденційні) та випадкові. Систематичні похибки виникають за умови, що під час формування вибіркової сукупності порушується принцип випадковості відбору (упереджений відбір елементів, недосконала основа вибірки тощо). Випадкові похибки — це наслідок випадковості відбору елементів сукупності для обстеження.

При організації вибіркового обстеження важливо запобігти виникненню систематичних похибок. Що стосується випадкових похибок, то уникнути їх неможливо, проте на основі теорії вибіркового методу можна визначити розмір і по можливості регулювати.

У практиці вибіркових спостережень використовують два типи вибіркових оцінок — точкові та інтервальні. Точкова оцінка — це значення параметра за даними вибірки: вибіркова середня х або вибіркова частка р. Інтервальна оцінка — це інтервал значень параметра, розрахований за даними вибірки для певної імовірності, тобто довірчий інтервал. Межі його визначаються на основі точкової оцінки та граничної похибки вибірки :

для середньої ;

для частки ,

де μ — середня, або стандартна похибка вибірки; t — квантиль розподілу ймовірностей (довірче число); та — середня та частка генеральної сукупності.

Стандартна похибка вибірки є середнім квадратичним відхиленням вибіркових оцінок від значень параметра генеральної сукупності:

при повторному відборі ,

при безповторному ,

де σ2 — вибіркова дисперсія; п та N — відповідно обсяг вибіркової та генеральної сукупностей.

При практичному використанні наведених формул слід враховувати, що:

1) дисперсія частки є добутком часток

 

2) у великих за обсягом сукупностях (30 і більше одиниць) поправка не вносить істотних змін у розрахунки, а тому враховується лише у малочисельних (малих) вибірках;

3) коригуючий множник для безповторної вибірки при малих величинах наближається до 1, а тому при 1—5% - вій вибірці розрахунок μ ведеться за формулою для повторної вибірки.

Простий випадковий відбір проводиться жеребкуванням або на основі таблиць випадкових чисел. Це класичний спосіб формування вибіркової сукупності і саме на ньому ґрунтується теорія вибіркового методу.

При механічному відборі основою вибірки є упорядкована чисельність елементів генеральної сукупності. Відбір елементів здійснюється через однакові інтервали, крок інтервалу залежить від частки вибірки. Так, при =0,05 крок інтервалу становить . Похибка механічної вибірки обчислюється за формулою безповторної вибірки. Для моментних спостережень, суть яких зводиться до фіксації стану безперервного процесу на певні моменти часу, використовують формулу похибки повторної вибірки. Розшарований (районований) відбір передбачає попередню структуризацію генеральної сукупності та незалежний відбір елементів у кожній складовій частині. Обсяг розшарованої вибірки — це сума частинних вибірок пj, тобто , де т— число складових частин (груп, типових районів тощо). При обчисленні похибки розшарованої вибірки використовують середню з групових дисперсій

 

Як правило, , отже, похибка розшарованої вибірки менша, ніж механічної чи простої випадкової. Найчастіше використовують відбір, пропорційний чисельності складових сукупності, тобто частка вибірки для всіх складових однакова.

При серійному відборі основа вибірки складається з серій елементів сукупності, зв'язаних територіально (райони, селища), організаційно (фірми, акціонерні товариства) тощо. Серії відбираються за схемою механічної або простої випадкової вибірки, обстеженню підлягають всі елементи серії. При обчисленні похибки вибірки враховується міжсерійна варіація:

 

де та — відповідно обсяг і середня k-ї серії.

Проектуючи вибіркові спостереження, визначають мінімально достатній обсяг вибірки, за якого вибіркові оцінки репрезентували б основні властивості генеральної сукупності:

для повторного відбору для безповторного

 

Для визначення обсягу вибірки п використовують оцінки дисперсій σ2 аналогічних пробних обстежень. Якщо такі обстеження відсутні, можна скористатися співвідношенням а для частки взяти найбільше значення дисперсії σ2=0,25.

Приклад 1: З метою визначення врожаю нового сорту пшениці була проведена 5% механічна вибірка, де обстежено 100 однакових за розміром дільниць, табл.26.

Розподіл дільниць за рівнем врожайності:

Врожайність, ц/га До 42 42-44 44-46 46-48 48-50 Більше 50
Посівна площа, га

Визначте: 1) використовуючи спосіб моментів: а) середню врожайність пшениці; б) дисперсію та середнє квадратичне відхилення;

2) коефіцієнт варіації;

3) з імовірністю 0,954 граничну помилку вибірки та межі, в яких можливо чекати середню врожайність пшениці. Зробіть висновки.

Рішення:

Врожайність, ц/га До 42 42-44 44-46 46-48 48-50 > 50 Сума
Посівна площа, га
Середина інтервалу  
  33,64 14,44 3,24 0,04 4,84 17,64  
  168,2 144,4 64,8 1,2 176,4

а) середня врожайність пшениці;

б) дисперсія та середнє квадратичне відхилення .

2) коефіцієнт варіації

3) Інтервальна оцінка — це інтервал значень параметра, розрахований за даними вибірки для певної імовірності, тобто довірчий інтервал. Межі його визначаються на основі точкової оцінки та граничної похибки вибірки для середньої

.

Стандартна похибка вибірки є середнім квадратичним відхиленням вибіркових оцінок від значень параметра генеральної сукупності. Для моментних спостережень, суть яких зводиться до фіксації стану безперервного процесу на певні моменти часу, використовують формулу похибки повторної вибірки:

.

Для імовірності 0,954 по таблиці t-розподілу Стьюдента t=2.

 

Висновки.

З імовірністю 0,954 можна стверджувати, що середня врожайність не менше 46,34 і не більше 47,26 ц/га.

Додаткова література:

1. Теорія статистики, О.І.Кулинич. – Київ, «Вища школа», 1992р., с. 95-105

2. Статистика: Навчальний посібник /Р.В.Фещур, А.Ф.Барківський, В.П. Кічор. 2-е вид. оновлене і доповнене. –Львів: «Інтелект-Захід», 2003р., с. 151-170

3. Теория статистики, под ред. Р.А.Шмойловой. – Москва, «Финансы и статистика», 1998р., с. 344-399

Бажаю успіхів!


 

Зміст

Вступ.. 1

Методологічні засади статистики.. 1

Статистичне спостереження. 2

Зведення й групування статистичних даних. 4

Подання статистичних даних: таблиці, графіки, карти. 7

Узагальнюючі статистичні показники. 18

Аналіз рядів розподілу. 32

Аналіз концентрації, диференціації та подібності розподілів. 37

Аналіз інтенсивності динаміки.. 40

Індексний метод. 44

Вибірковий метод…………………………………………………………………..47