Дискриминантный анализ

Как и для множественной регрессии, главное назначение дискриминантного анализа – прогнозирование и определение относительной важности предикторов. Ключевое различие между этими двумя методами состоит в том, что множественная регрессия требует, чтобы зависимая переменная была измерена в интервальной или относительной шкале, а дикриминнантный анализ использует категориальную зависимую переменную. В то время как множественную регрессию можно использовать для вычисления степени интереса к покупке данного товара (услуги), дискриминантный анализ можно использовать для определения того, покупает или не покупает респондент данный товар.

Также возможна ситуация, когда маркетолог захочет преобразовать переменную, измеренную интервальной или относительной шкалой, в номинальную переменную. Например, вы получили данные о возрасте респондентов, измеренном в годах. Позже, в ходе анализа, вы решите построить модель, чтобы распределить респондентов согласно критерию «молодой»-«старый», и соответственно разделите всех респондентов на две группы. Это опасно, поскольку это не естественно наблюдаемые группы, и правило, которое вы применили для создания групп, может скрыть смысл результата. Мы советуем вам использовать дискриминантный анализ для естественных групп.

Как определить «управленческую» значимость дискриминантного анализа? Необходимо посмотреть, настолько хорошо он показывает групповую принадлежность. В идеале точность классификации следует оценивать по проверочной выборке, потому что, как и во множественной регрессии, применение коэффициентов дискриминантной функции к выборке, на основе которой они и построены, приведет к надуманно высокой точности предсказания. Результат дискриминантного анализа должен содержать итоговую таблицу вычисленной групповой принадлежности по сравнению с фактической групповой принадлежностью. Спросите себя: действительно ли коэффициенты дискриминантной функции определили каждого респондента в предназначенную ему одну группу? Действительно ли появление ошибки ограничено одной группой? Кроме того, рассмотрите общую точность, сравнив процент попадания (т.е. процент верно классифицированных респондентов) с ожидаемым на основе случайности попадания. Хорошее эмпирическое правило заключается в том, чтобы, по крайней мере, на 20% улучшить процент попадания по сравнению со случайным попаданием, рассчитываемым как сумма квадратов априорных вероятностей для каждой группы. Например, если 30% респондентов принадлежит группе А, а оставшиеся 70% - группе В, то случайность попадания равна (0,3²) + (0,7²) или 0,58, а мы хотели бы, чтобы процент попадания был, по крайней мере, на 20% выше или (1,2)×(0,58) = 0,70, т.е. 70%.