Дисперсионный анализ

Дисперсионный анализ (ANOVA) чрезвычайно полезный инструмент в практике маркетинговых исследований, поскольку именно его используют чаще всего для снижения кумулятивной ошибки. Она представляет собой кумулятивный эффект ошибки I рода (ошибка первого рода означает утверждает, что два числа различаются, когда фактически они не различаются между собой) во всех парных сравнениях. Однако, прежде чем вы решите использовать дисперсионный анализ, вы должны убедиться, что вы имеете соответствующие данные. Дисперсионный анализ служит методом выявления различий между номинальными независимыми переменными, влияющими на значения метрической зависимой переменной. Помимо того, что вы должны иметь номинальную независимую переменную (например, торговую марку, товар) и метрическую зависимую переменную (например, рейтинги эффективности, рейтинги важности, уровни осведомленности), ваши данные должны удовлетворять следующим допущениям дисперсионного анализа: значение переменных в выборке должны подчиняться закону нормального распределения и дисперсии совокупностей должны быть равны. Если окажется, что данные в значительной степени не удовлетворяют этим допущениям, то следует использовать непараметрические методы, например критерий Краскела –Уоллеса.

Если вы установили, что для анализа ваших данных подходит дисперсионный анализ, то запустите программу его выполнения и вычислите значение F-статистики, чтобы определить значимость полученного результата. Использование F-статистики позволяет проверить нулевую гипотезу об одинаковых значениях уровней независимых переменных с помощью сравнения дисперсии, обусловленной факторным экспериментом, с дисперсией, обусловленной ошибкой.

Чем выше отношение факторной дисперсии, обусловленной ошибкой, т.е., чем выше значение F, тем выше вероятность отклонения нулевой гипотезы об отсутствии различий между средними факторного эксперимента. Если вы используете компьютерную программу SAS или SPSS для выполнения дисперсионного анализа, то программа выдаст вам p-значение, соответствующее значению F. Как всегда, если вы используете 95% -ный доверительный уровень, p-значение, меньшее 0,05, свидетельствует о статистической значимости F-критерия.

Если нулевую гипотезу отклоняют, то необходимо дополнительно сравнить различия в изолированных группах. Существует ряд критериев для проверки парных сравнений, включая ранговый критерий Стьюдента-Ньюмана–Кеулза, альфа-критерий согласия Бонферрони, альфа-критерий согласия Шефе, альфа-критерий Тьюкея. Самый легкий и самый консервативный из них – альфа-критерий согласия Бонферрони. Чтобы выполнить эту проверку, вы должны запустить программу выполнения парных сравнений с помощью t-критериев, как вы обычно делаете, но вместо того, чтобы сравнивать каждое проверяемое с вашим общим уровнем значимости (a=0,05, если желаемый доверительный уровень составляет 95%), вы сравниваете каждое p-значение с вновь вычисленным значение альфа, которое представляет собой вероятность допустить ошибку первого рода. Значения альфа-критерия согласия Бонферрони вычисляют по следующей формуле:

Исходное значение альфа × 2

—————————————————

(число категорий)×(число категорий-1)