Часть 111. Сбор, подготовка и анализ данных

Множественная регрессия

Множественная регрессия — испытанный и надежный метод маркетинговых исследовани! применяемый, главным образом, для прогнозирования и объяснения относительного вклад предикторов в изменение определенной зависимой переменной. Чаще всего мы задаем такой вс прос: "Насколько тесной должна быть зависимость между переменными, чтобы ее принимать i внимание?" Ответ зависит от того, с какой целью вы проводите анализ и зачем вам нужны резуш таты. Если вы хотите узнать, какие из предикторов наиболее сильно влияют на зависимую пер< менную, то лучше всего это покажет изучение нормированных коэффициентов регрессии (f коэффициенты). Если вы хотите делать прогнозы с помощью полученной вами модели, то сто* посмотреть на стандартную ошибку модели. Менеджер не оценит вашу работу, если вы получи' высокое значение коэффициента корреляции R2, но диапазон ошибки прогнозирования состав* 50% от предсказываемого значения. Существует процедура строгой проверки полученных резул! татов, предусматривающая использование контрольной выборки.

Дискриминантный анализ

Как и для множественной регрессии, главное назначение дискриминантного анализа-прогнозирование и определение относительной важности предикторов. Ключевое различи между этими двумя методами состоит в том, что множественная регрессия требует, чтобы зав* симая переменная была измерена в интервальной или относительной шкале, а дискриминанп ный анализ использует категориальную зависимую переменную. В то время как множестве!-ную регрессию можно использовать для вычисления степени интереса к покупке данного товг ра (услуги), дискриминантный анализ можно использовать для определения того, покупав или не покупает респондент данный товар.

Также возможна ситуация, когда маркетолог захочет преобразовать переменную, измеренну интервальной или относительной шкалой, в номинальную переменную. Например, вы получил данные о возрасте респондентов, измеренном в годах. Позже, в ходе анализа, вы решите построй! модель, чтобы распределить респондентов согласно критерию "молодой"—"старый", и соответсп венно разделите всех респондентов на две группы. Это опасно, поскольку это не естественно Не блюдаемые группы, и правило, которое вы применили для создания групп, может скрыть смыс результата. Мы советуем вам использовать дискриминантный анализ для естественных групп.

Как определить "управленческую" значимость дискриминантного анализа? Необходимо пс смотреть, насколько хорошо он показывает групповую принадлежность. В идеале точность клас сификации следует оценивать по проверочной выборке, потому что, как и во множественной pel рессии, применение коэффициентов дискриминантной функции к выборке, на основе которо они и построены, приведет к надуманно высокой точности предсказания. Результат дискрими нантного анализа должен содержать итоговую таблицу вычисленной групповой принадлежност по сравнению с фактической групповой принадлежностью. Спросите себя: действительно ли кс эффициенты дискриминантной функции определили каждого респондента в предназначенну] ему одну группу? Действительно ли появление ошибки ограничено одной группой? Кроме топ рассмотрите общую точность, сравнив процент попадания (т.е. процент верно классифицирован ных респондентов) с ожидаемым на основе случайности попадания. Хорошее эмпирическое прг вило заключается в том, чтобы, по крайней мере, на 20% улучшить процент попадания по сравне нию со случайным попаданием, рассчитываемым как сумма квадратов априорных вероятносте для каждой группы. Например, если 30% респондентов принадлежит группе А, а оставшиес 70% — группе Д то случайность попадания равна (0,32) + (0,72) или 0,58, а мы хотели бы, чтоб] процент попадания был, по крайней мере, на 20% выше или (1,2) х (0,58) = 0,70, т.е. 70%.

Факторный анализ

Чаще всего факторный анализ используют для снижения числа данных и установления ха рактера взаимосвязи переменных. Мы можем задать 20 вопросов на одну тему, но с их помо шью в действительности можно оценить небольшое число восприятий респондентами какого