Таблиця 5.1. Математичні операції в різних шкалах

Назва шкали Можливі операції
Класифікації
Порядку
Інтервальна
Відношення

 

В залежності від виду шкал вимірювання змінних для дослідження зв’язків між ними використовують різні статистичні методи: регресійний і кореляційний аналіз, аналіз расових рядів, дисперсійний і коваріаційний аналіз, тощо.

Відзначимо дві найпростіші властивості залежностей між змінними: величина залежностіі надійність залежності.

Величину залежності легше зрозуміти і виміряти, ніж надійність. Наприклад, якщо будь-який чоловік у вибірці мав значення WCC (рівень лейкоцитів у крові) вищий, ніж будь-яка жінка, то ми можемо сказати, що залежність між двома змінними (стать і WCC) дуже висока. Іншими словами, можливо передбачити значення однієї змінної по значенню іншої. Надійність ("істинність") залежності означає ймовірність, що залежність, подібна знайденій нами, буде знову виявлена (іншими словами, підтвердиться) на даних іншої вибірки, взятої з тієї ж самої генеральної сукупності. Слід пам'ятати, що вивчення даної конкретної вибірки не є кінцевою метою дослідження; вибірка представляє інтерес лише постільки, оскільки вона дає інформацію про всю генеральну сукупність. Якщо наше дослідження задовольняє деяким спеціальним критеріям (про це буде сказано пізніше), то надійність знайдених залежностей між змінними нашої вибірки можна кількісно оцінити і представити за допомогою стандартної статистичної міри (так званий p-рівень або статистичний рівень значущості). Статистична значущість результату представляє собою міру впевненості в його "істинності" .

Як визначити, чи є результат дійсно значущим? Не існує ніякого способу уникнути свавілля при ухваленні рішення про те, який рівень значущості слід дійсно вважати "значущим". Вибір певного рівня значущості, вище за який результати відкидаються як помилкові, є достатньо довільним. На практиці остаточне рішення залежить від того, чи був результат передбачений апріорі (тобто до проведення досліду) або виявлений апостапріорно в результаті багатьох аналізів і порівнянь, виконаних з безліччю даних, а також на традиції, наявній в даній області досліджень. Зазвичай в багатьох областях результат p<0,05 є прийнятною межею статистичної значущості, проте слід пам'ятати, що цей рівень все ще включає досить велику ймовірність помилки (5%). Результати, на рівні p<0,05 зазвичай розглядаються як статистично значущі, а результати з рівнем p<0,005 або p<0,001 як високо значущі. Проте слід розуміти, що дана класифікація рівнів значущості достатньо довільна і є всього лише неформальною угодою, прийнятою на основі практичного досвіду в тій або іншій області дослідження.