Метод аналітичних групувань

Метод аналітичних угрупувань полягає в тому, що всі елементи сукупності групують за факторною ознакою х і в кожній групі обчислюють середні значення результативної ознаки у, тобто лінія регресії оцінюється лише в окремих крапках.

На 1-му етапі аналізу вибирають факторну ознаку та визначають число груп й межі інтервалів (див. табл. 8.2).

На 2-му етапі проводиться оцінка лінії регресії. В моделі аналітичного групування – це емпірична лінія регресії, яка представлена груповими середніми результативної ознаки , кожна з яких належить до відповідного інтервалу значень групувального фактора хj.

За наведеними даними можна не лише стверджувати, що існує кореляційний зв’язок між факторною х і результативною у ознаками, а й визначити, як у середньому змінюється у зі зміною х на одиницю. Ефекти впливу х на у визначаються відношенням приростів середніх групових цих величин

Наприклад, у другій групі порівняно з першою потужність устаткування більша на 200 од./годину, а продуктивність праці на 22,9 - 20,0 = 2,9 од./люд.-зміну. Звідси

.

Тобто, зі зростанням потужності устаткування на 100 од./год. продуктивність праці зростає в середньому на 1,45 од. / люд.-зміну (або при зростанні потужності на 1 од. продуктивність праці росте на 0,0145 од.)

Аналогічно розраховані ефекти у третій групі становлять 0,95, у четвертій — 0,65 од./люд.-зміну.

 

3-й етап - вимір щільності зв'язку - базується на правилі складання дисперсій.

Як зазначалося в темі 5, відхилення індивідуальних значень ознаки у від загальної середньої можна подати як дві складові: . У методі аналітичних групувань - це відхилення індивідуальних значень у від групових середніх та відхилення групових середніх від загальної середньої.

Розглянемо економічний сенс цих відхилень. Всі підприємства однієї групи мають приблизно однаковий рівень потужності устаткування, тобто на групову варіацію рівень продуктивності устаткування не впливає. Групові та середня з групових дисперсій характеризують варіацію результативної ознаки, пов'язану з варіацією всіх ознак, окрім потужності устаткування (наприклад, може враховувати вплив різної електроозброєності й таке інше). Міжгрупова дисперсія характеризує варіацію, пов'язану з варіацією груповочної ознаки (потужність устаткування). Тому міжгрупову дисперсію називають факторною, а середню з групових – залишковою. Взаємозв'язок цих дисперсій описується правилом складання дисперсій

 

Очевидно, значення факторної дисперсії буде тим більшим, чим сильніший вплив фактора х на y. Відношення міжгрупової (факторної) дисперсії до загальної розглядається як міра щільності зв’язку за даними аналітичного групування й називається кореляційним відношенням

де d2 — міжгрупова дисперсія, яка вимірює варіацію ознаки у під впливом фактора х,

s2 — загальна дисперсія.

Кореляційне відношення показує яка частка загальної варіації результативної ознаки у пояснюється варіацією груповочної ознаки х.

Застосуємо кореляційне відношення для оцінювання щільності зв’язку між показниками за даними таблиці 8.2. Розрахунки загальної та факторної дисперсій подано в табл. 8.3 та 8.4.

Згідно з розрахунками загальна дисперсія становить 5,19, факторна — 3,86:

;

.

Кореляційне відношення

,

тобто 74,5% варіації продуктивності праці на підприємствах регіону пояснюється варіацією продуктивності одиниці устаткування.

 

Таблиця 8.3 – Розрахунок загальної дисперсії в аналітичному групуванні

()

Продуктивність праці робітника, од./люд.-зміну 18—20 0—22 22—24 24—26 26—28 Разом
Кількість підприємств
´
– 4,5 –2,5 –0,5 1,5 3,5 ´
182,25 93,75 8,5 63,0 171,5

Таблиця 8.4 – Розрахунок факторної дисперсії в аналітичному групуванні

()

Продуктивність одиниці устаткування, од./годину
До 300 20,0 –3,5 208,25
300 — 500 22,9 –0,6 14,40
500 — 700 24,8 1,3 42,25
700 і більше 26,1 2,6 121,68
У цілому 23,5 ´ 386,58

 

4-й етап - перевірка істотності зв'язку Кореляційне відношення змінюється від 0 до 1. При =1 міжгрупова дисперсія рівна загальній, тобто кожному значенню факторної ознаки відповідає одне значення результативної ознаки й зв'язок між ознаками функціональний. При =0 міжгрупова дисперсія дорівнює нулю.

Проте, умова >0 не завжди є доказом наявності кореляційного зв'язку між ознаками. Відмінне від нуля кореляційне відношення може з'явитися й при випадковому розподілі сукупності на групи.

Перевірка істотності кореляційного зв'язку ґрунтується на порівнянні фактичного значення з критичним, яке є максимально можливим значенням кореляційного відношення, яке може виникнути випадково за відсутності кореляційного зв'язку. Якщо фактичне значення більше критичного, то зв'язок між ознаками не випадковий (істотний).

Критичне значення позначається (,), тобто розподіл в таблицях критичних значень (макет таблиці наведено таблицею 8.5) надається для рівня істотності a (звичайно 0,05 або 0,01) та залежить від числа ступенів свободи міжгрупової k1 та середньої з групових k2 дисперсій.

= m - 1;

= n - m

 

де n, m - відповідно число одиниць сукупності та кількість груп.

 

Визначимо критичне значення кореляційного відношення для нашого прикладу: k1 = 4 – 1 = 3 та k2 = 100 – 4 = 96. Оскільки значення k2 = 96 у таблиці критичних значень відсутнє, можна використати найближче до нього число k2 = 100. Критичне значення .

Розраховане кореляційне відношення h2 = 0,745 значно перевищує критичне, а отже зв’язок між потужністю одиниці устаткування та продуктивністю праці робітника з імовірністю 0,95 визнається істотним.

Для перевірки істотності зв'язку використовують також функціонально пов'язану з характеристику F-критерій (критерій Фішера), який визначається за формулою:

 

Перевірку значущості зв'язку з його допомогою здійснюють аналогічно описаному вище для кореляційного відношення. Результати перевірки будуть ідентичні.

 

Таблиця 8.5 - Критичні значення кореляційного відношенняй коефіцієнта детерміації R2 для рівня значущості a=0,05

. .   0,219