Властивості коефіцієнта кореляції Пірсона

1) Коефіцієнт кореляції Пірсона приймає значення на проміжку , тобто .

2) Якщо , то зв’язок вважається слабким; якщо , то зв’язок вважається середнім; , то зв’язок вважається сильним.

3) Якщо , то зв’язок називається додатнім, тобто зі збільшенням значень Х значення Y також збільшуються. Якщо , то зв’язок називається від’ємним, тобто зі збільшенням значень Х значення Y зменшуються.

Зауваження. Слід пам’ятати, що коефіцієнт кореляції Пірсона показує силу лінійного зв’язку. Якщо між Х та Y існує сильний нелінійний зв’язок, коефіцієнт кореляції Пірсона може дорівнювати нулю.

Оскільки сила зв’язку між Х та Y оцінюється за вибірковими даними, то необхідна перевірка її статистичної значущості, тобто оцінка можливості розповсюдити отримані результати на всю генеральну сукупність.

Перевірка статистичної значущості коефіцієнта кореляції Пірсона здійснюється за допомогою так званої t-статистики, яка розраховується за формулою:

. (3.4)

Розраховане значення t-статистики порівнюється з критичним значенням tкрит. tкрит – табличне значення розподілу Стьюдента, яке також можна знайти за допомогою вбудованої статистичної функції Excel СТЬЮДРАСПОБР (; l), де – обраний дослідником рівень значущості, l – ступені волі, l=п-2.

Якщо розраховане значення t-статистики більше критичного, то коефіцієнт кореляції вважається значимим на обраному рівні .

 

ПРИКЛАДЗа наявними даними про рівень механізації праці Х (%) і продуктивності праці Y (од. продукції/год.) для 14 однотипних підприємств (табл. 3.3) оцінити тісноту зв'язку між Х і Y. Визначити можливість розповсюдження результатів розрахунків на всі підприємства такого типу.

Х
Y

Розв’язок. Дані таблиці 3.3 є вибіркою значень Х і відповідних значень Y. Оскільки кількість даних невелика (п=14), то їх можна не групувати. Для оцінки тісноти зв'язку між Х і Y розрахуємо коефіцієнт кореляції Пірсона за формулою (3.3.) для незгрупованих даних. Розрахунки для зручності оформимо у вигляді таблиці.

Суми

Отже,

За значенням коефіцієнта кореляції можна зробити висновок, що між Х і Y існує сильний додатній зв’язок.

Перевіримо статистичну значущість знайденого коефіцієнта кореляції Пірсона. Розрахуємо t-статистику за формулою (3.4): . Знайдемо tкрит, враховуючи, що l=п-2=14-2=12. Оберемо рівень значущості =0,01. Тоді tкрит=СТЬЮДРАСПОБР (0,01; 12)=3,055.

Оскільки розраховане значення t-статистики більше критичного, то коефіцієнт кореляції можна вважати значимим на обраному рівні =0,01.

Висновок. Між рівнем механізації праці та її продуктивністю на підприємствах, що досліджувалися, існує сильний додатній зв’язок: чим більше рівень механізації праці, тим вище її продуктивність. Висновок дійсний для всіх підприємств такого типу.

 

ПРИКЛАД 3.2. За наявними даними про річний об'єм виробництва Y (тис. од. продукції) та основні фонди Х (тис. у. од.) для 20 однотипних підприємств (табл. 3.5) оцінити тісноту зв'язку між Х і Y. Визначити можливість розповсюдження результатів розрахунків на всі підприємства такого типу.

Таблиця 3.5

Х   Y 12,5 17,5 22,5 27,5
20,5 - - -
21,5 - - -
22,5 - -
23,5 - -
24,5 - - -

Розв’язок. Згруповані вибіркові дані (табл. 3.5) запишемо у вигляді кореляційної таблиці (табл. 3.6).

Таблиця 3.6

хі yj 12,5 17,5 22,5 27,5
20,5
21,5
22,5
23,5
24,5 - - -
 

Для розрахунку коефіцієнта кореляції Пірсона скористуємось формулою (3.2). Розрахунки для зручності оформимо у вигляді таблиці (табл. 3.7).

Таблиця 3.7

хі yj хі yj хі2 хі2 yj2 yj2
12,5 20,5 12,5 20,5 156,25 156,25 420,25 420,25
17,5 21,5 52,5 306,25 918,75 462,25 924,5
22,5 22,5 112,5 67,5 506,25 2531,3 506,25 1518,8
27,5 23,5 302,5 756,25 8318,8 552,25 3313,5
    24,5       600,25
Суми
           

Окремо розрахуємо :

+

Підставимо знайдені суми в формулу (3.2):

 

.

За значенням коефіцієнта кореляції можна зробити висновок, що між Х і Y існує сильний додатній зв’язок.

Перевіримо статистичну значущість знайденого коефіцієнта кореляції Пірсона. Розрахуємо t-статистику за формулою (3.4): . Знайдемо tкрит, враховуючи, що l=п-2=20-2=18. Оберемо рівень значущості =0,01. Тоді tкрит=СТЬЮДРАСПОБР (0,01; 18)=2,88.

Оскільки розраховане значення t-статистики більше критичного, то коефіцієнт кореляції можна вважати значимим на обраному рівні =0,01.

Висновок. Між річним об'ємом виробництва та основними фондами на підприємствах, що досліджувалися, існує сильний додатній зв’язок. Висновок дійсний для всіх підприємств такого типу.