Використання статистичних методів для аналізу даних

Під час обробки результатів маркетингових досліджень використовують такі види аналізу: дескриптивний, статистичний висновок, аналіз відмінностей, ана­ліз зв'язків і прогнозний.

В основі дескриптивного аналізу лежать такі статистичні міри, як середня величина, мода, середнє квадратичне відхилення, розмах і амп­літуда варіації.

Аналіз, в основі якого лежить перевірка гіпотези з метою узагаль­нення отриманих результатів на всю сукупність, називають статистич­ним висновком.

Аналіз відмінностейвикористовують для порівняння результатів дослідження двох груп респондентів для визначення ступеня реальної відмінності в їх пове­дінці.

Аналіз зв'язків передбачає визначення систематичних зв'язків (їх тісноти) змінних.

Прогнозний аналіз використовують для прогнозу розвитку подій у майбу­тньому, наприклад, через аналіз статистичних рядів.

До мір центральної тенденції належать мода, медіана і середня. Мода характе­ризує величину ознаки, яка появляється частіше ніж інші величини цієї ознаки. Медіана характеризує серединне значення ознаки, яке воно займає в упорядко­ваному ряду значень даної ознаки. Третя міра центральної тенденції це — середня величина, яка найчастіше розраховується як середня арифметична величина.

Але розглянуті міри не характеризують варіацію відповідей респондентів на те чи інше питання. Для такої оцінки використовують три міри варіації: роз­поділ частот, розмах варіації і середнє квадратичне відхилення.

Розподіл частот – це число випадків появи кожного значення ознаки в певному вибраному діапазоні її значень. Розподіл частот дозволяє зробити швидкі висновки про ступінь детальності результатів вимірювання.

Розмах варіації визначає абсолютну різницю між максимальним і мінімальним значеннями вимірювальної ознаки:

, (4.2)

де: - розмах варіації Х;

- максимальне і мінімальне значення ознаки Х.

Середнє квадратичне відхилення – узагальнена статистична характеристика варіації значень ознаки.

, (4.3)

 

— середньоквадратичне відхилення ознаки;

—i-те значення даної ознаки;

— середнє значення ознаки; n — кількість значень даної ознаки.

Вибір шкали вимірювання, а отже і типу запитання в анкеті передбачає отримання певної кількості інформації. Статистичні міри надають можливість отримання більшої кількості інформації, застосовуючи найбільш інформативні шкали вимірювання. При використанні номінальної шкали мір застосовується розподіл частот, при використанні шкали порядків — кумулятивний розподіл частот, при використанні інтервальної шкали і шкали відношень — середнє квадратичне відхилення.

Статистичний висновок – це вид логічного аналізу, який дає змогу отримати узагальнення інформації, одержаної на основі дослідження вибіркових одиниць сукупності, на всю генеральну сукупність. Одним із вирішальних факторів для отримання правильних висновків є розмір вибірки. Статистичний висновок складається з двох методів:

а). Оцінка параметрів генеральної сукупності. Для цього використовують наступні статистичні показники: середню величину для вибірки, середню квадратичну помилку і відповідний рівень довіри (звичайно 95% або 99%) і інтервал довіри параметра, який досліджується.

Середня квадратична помилка є мірою варіації вибіркового розподілу при умові, що досліджувалась множина незалежних вибірок однієї і тієї: генеральної сукупності. Вона визначається за формулою:

де — середня квадратична помилка вибіркової середньої;

- середнє квадратичне відхилення від середньої величини у вибірці; n — обсяг вибірки.

Якщо використовувати процентні міри, що виражають альтернативну змі­ну якісних ознак, то

 

 

р — процент респондентів у вибірці, які підтримують першу альтернативу; q = (100 — р) — процент респондентів у вибірці, які підтримують другу аль­тернативу; п — обсяг вибірки.

— середня квадратична помилка вибіркової середньої при використанні процентних мір;

Як бачимо, середня помилка вибірки тим більша, чим більша варіація, і тим менша, чим більший обсяг вибірки.

Оскільки завжди існує вибіркова помилка, то необхідно оцінити розсію­вання параметра генеральної сукупності. Допустимо, що вибрано рівень дові­ри, який дорівнює 99%. Йому відповідає параметр t= 2,58. Тоді середнє зна­чення параметра генеральної сукупності знаходять за формулою:

де — відповідно середнє значення ознаки для генеральної сукупності і вибірки.

Якщо використовувати міри, то:

де P i p — відповідно процент респондентів у генеральній сукупності та у ви­бірці, які підтримують першу альтернативу.

Подане визначення середнього значення середньої означає, що при 99%-му рівні довіри діапазон оцінок включає істинну для генеральної сукуп­ності оцінку.

Таким чином, логіка статистичного аналізу спрямована на отримання кін­цевих значень досліджуваного параметра. Крім того, визначається дисперсія, яка характеризує міру розсіювання параметра, а також характер розподілу, фор­му і тісноту зв'язку між змінними.