Використання статистичних методів для аналізу даних

Під час обробки результатів маркетингових досліджень використовують такі види аналізу: дескриптивний, статистичний висновок, аналіз відмінностей, аналіз зв'язків і прогнозний.

В основі дескриптивного аналізу лежать такі статистичні міри, як середня величина, мода, середнє квадратичне відхилення, розмах і амплітуда варіації.

Аналіз, в основі якого лежить перевірка гіпотези з метою узагальнення отриманих результатів на всю сукупність, називають статистичним висновком.

Аналіз відмінностейвикористовують для порівняння результатів дослідження двох груп респондентів для визначення ступеня реальної відмінності в їх поведінці.

Аналіз зв'язків передбачає визначення систематичних зв'язків (їх тісноти) змінних.

Прогнозний аналіз використовують для прогнозу розвитку подій у майбутньому, наприклад, через аналіз статистичних рядів.

До мір центральної тенденції належать мода, медіана і середня. Мода характеризує величину ознаки, яка появляється частіше ніж інші величини цієї ознаки. Медіана характеризує серединне значення ознаки, яке воно займає в упорядкованому ряду значень даної ознаки. Третя міра центральної тенденції це — середня величина, яка найчастіше розраховується як середня арифметична величина.

Але розглянуті міри не характеризують варіацію відповідей респондентів на те чи інше питання. Для такої оцінки використовують три міри варіації: розподіл частот, розмах варіації і середнє квадратичне відхилення.

Розподіл частот – це число випадків появи кожного значення ознаки в певному вибраному діапазоні її значень. Розподіл частот дозволяє зробити швидкі висновки про ступінь детальності результатів вимірювання.

Розмах варіації визначає абсолютну різницю між максимальним і мінімальним значеннями вимірювальної ознаки:

, (4.2)

де: - розмах варіації Х;

- максимальне і мінімальне значення ознаки Х.

Середнє квадратичне відхилення – узагальнена статистична характеристика варіації значень ознаки.

, (4.3)

— середньоквадратичне відхилення ознаки;

—i-те значення даної ознаки;

— середнє значення ознаки; n — кількість значень даної ознаки.

Вибір шкали вимірювання, а отже і типу запитання в анкеті передбачає отримання певної кількості інформації. Статистичні міри надають можливість отримання більшої кількості інформації, застосовуючи найбільш інформативні шкали вимірювання. При використанні номінальної шкали мір застосовується розподіл частот, при використанні шкали порядків — кумулятивний розподіл частот, при використанні інтервальної шкали і шкали відношень — середнє квадратичне відхилення.

Статистичний висновок – це вид логічного аналізу, який дає змогу отримати узагальнення інформації, одержаної на основі дослідження вибіркових одиниць сукупності, на всю генеральну сукупність. Одним із вирішальних факторів для отримання правильних висновків є розмір вибірки. Статистичний висновок складається з двох методів:

а). Оцінка параметрів генеральної сукупності. Для цього використовують наступні статистичні показники: середню величину для вибірки, середню квадратичну помилку і відповідний рівень довіри (звичайно 95% або 99%) і інтервал довіри параметра, який досліджується.

Середня квадратична помилка є мірою варіації вибіркового розподілу при умові, що досліджувалась множина незалежних вибірок однієї і тієї: генеральної сукупності. Вона визначається за формулою:

де — середня квадратична помилка вибіркової середньої;

- середнє квадратичне відхилення від середньої величини у вибірці; n — обсяг вибірки.

Якщо використовувати процентні міри, що виражають альтернативну зміну якісних ознак, то

р — процент респондентів у вибірці, які підтримують першу альтернативу; q = (100 — р) — процент респондентів у вибірці, які підтримують другу альтернативу; п — обсяг вибірки.

— середня квадратична помилка вибіркової середньої при використанні процентних мір;

Як бачимо, середня помилка вибірки тим більша, чим більша варіація, і тим менша, чим більший обсяг вибірки.

Оскільки завжди існує вибіркова помилка, то необхідно оцінити розсіювання параметра генеральної сукупності. Допустимо, що вибрано рівень довіри, який дорівнює 99%. Йому відповідає параметр t= 2,58. Тоді середнє значення параметра генеральної сукупності знаходять за формулою:

де — відповідно середнє значення ознаки для генеральної сукупності і вибірки.

Якщо використовувати міри, то:

де P i p — відповідно процент респондентів у генеральній сукупності та у вибірці, які підтримують першу альтернативу.

Подане визначення середнього значення середньої означає, що при 99%-му рівні довіри діапазон оцінок включає істинну для генеральної сукупності оцінку.

Таким чином, логіка статистичного аналізу спрямована на отримання кінцевих значень досліджуваного параметра. Крім того, визначається дисперсія, яка характеризує міру розсіювання параметра, а також характер розподілу, форму і тісноту зв'язку між змінними.