Інтервали довіри для коефіцієнтів кореляції

 

Очевидно, що вибірковий коефіцієнт кореляції як випадкова величина має асиметричний розподіл (особливо при малих вибірках і великих за модулем значеннях). Це неважко зрозуміти, коли уявити, що, наприклад, при =0,8 вибіркові коефіцієнти в інших вибірках можуть перебільшити цю величину тільки на 0,2, тоді як у бік зменшення вони можуть знаходитись від неї на 0,8. Доведено, що при збільшенні об‘єму вибірки ця асиметрія зменшується. Як же побудувати інтервали довіри (довірчі границі) для коефіцієнта кореляції?

Зручний підхід для розв‘язання цієї задачі запропонував в 1921 р. Р.Фішер. Він сконструював перетворення випадкової величини у випадкову величину z:

, (2.4)

яка розподілена майже за нормальним законом (симетрично) з середнім квадратичним відхиленням

.

Отже для випадкової величини z, як і для будь − якої нормально розподіленої величини, гранична помилка вибірки з ймовірністю 0,95 не перевищить

. (2.5)

Знайдемо нижню і верхню границі інтервалу довіри для z, тобто

і ,

а потім і границі довіри для коефіцієнта кореляції. Для цього можна скористатися спеціальною таблицею z – перетворення Р.Фішера (додаток 4).

Побудуємо інтервали довіри для коефіцієнтів кореляції в нашому прикладі. Нагадаємо, що rРЕ=0,8981; rРК=0,7513; n=29. За формулою (3.4) знаходимо

,

і визначаємо за формулою (2.5) нижні й верхні границі інтервалів довіри для z.

нижня верхня

для ZE

для ZK

Тепер за таблицею Z-перетворення Р.Фішера (додаток 4) по знаходимо довірчі границі для теоретичних коефіцієнтів кореляції ():

0,79 ≤≤0,95;

0,53 ≤≤0,88.

Звернемо увагу, що одержані границі (0,79-0,95) і (0,53 – 0,88) не знаходяться на однаковій відстані від вибіркових значень коефіцієнтів кореляції 0,90 і 0,75, що свідчить про асиметричний розподіл вибіркових коефіцієнтів кореляції.

На закінчення розгляду питання про оцінки значущості й інтервалів довіри для коефіцієнтів кореляції додатково зауважимо наступне:

1) якщо коефіцієнт кореляції від’ємний, то в розрахунках (див. формулу (2.3) ніяких особливостей або ускладнень не виникає, але в розрахунках (формула 2.4) коефіцієнт кореляції треба приймати за модулем;

2) якщо коефіцієнт кореляції має невелике значення, наприклад, 0,25, тоді за формулою (2.4) z=0,255, (за формулою (2.5)=0,384 і нижня границя інтервалу довіри для z набуває від‘ємного значення: -0,129 (0,255-0,384). Це означає, що і інтервал довіри для також включає значення 0. Така незалежна змінна, безумовно, є незначущою і її напевно слід вилучити з подальшого процесу моделювання.