Первоначальная обработка маркетинговой информации

⇐ Назад

Обработка начинается с преобразования данных в осмысленную информацию. Преобразование данных включает в себя:

ü Введение данных в компьютер

ü Проверку на предмет ошибок

ü Кодирование

ü Табулирование, представление данных в виде таблиц

Для этого необходимо:

1. Исключить не пригодные для обработки данные. Отсеивается часть анкет из-за не правильного заполнения.

ü Анкета заполнена на 50%

ü Из-за явно не верных ответов

ü Из-за фальсификации

1. Проверка на читаемость и отсутствие противоречий в ответах

2. Кодирование данных (до занесения в компьютер)

3. Ввод в компьютер

4. Добавление новых переменных

5. Обработка информации

Существует 3 вида анализа маркетинговой информации:

1. статистический анализ

2. конъюнктурный анализ

3. прикладной анализ

I ступень

Статистический анализ

Статистический анализ представляет собой анализ информации по определенным показателям. Он выполняется как по первичной информации, так и по вторичной информации. Основные программы – Excel, SPSS. Информация представлена в виде таблиц.

Виды статистического анализа:

I. Дескриптивный анализ

I.1. Меры центральной тенденции

I.1.1. Средние величины

I.1.2. Мода

I.1.3. Медиана

I.2. Меры вариации

I.2.1. Показатели, описывающие степень схожести и не схожести

I.2.2. Размах вариации

I.2.3. Межквартильный размах

I.2.4. Дисперсия

I.2.5. Среднее квадратическое отклонение

I.2.6. Коэффициент вариации

II. Выводной анализ

III. Анализ гипотез

IV. Анализ связей

V. Предсказательный анализ (прогнозы)

I. Дескриптивный анализ

Первоначально рассчитываются меры вариации.

Сначала считаются частотные процентовочные таблицы.

Распределение частот – число случаев появления каждого значения измеренной характеристики в каждом выбранном диапазоне.

Затем проводится сортировка потребителя на сегменты. При проектировании МИ закладывали гипотезу. На основании этой гипотезы сортируем потребителя на сегменты, и по каждому сегменту опять рассчитываются частотные таблицы.

По этим частотным таблицам (не по всем, по тем, которым нужно только), необходимы средние. В качестве средних может выступать среднеарифметическое, среднегеометрическое, мода или медиана (если не числовой показатель). Сразу же рассчитываются и показатели отклонения от средней. По вопросам, связанным со спросом, считается еще и ошибка выборки обязательно.

Мода – значение признака, появляющееся наиболее часто.

Медиана – точка на шкале измеренных значений, ниже и выше которой лежит по половине всех значений.

Разность между средним значением переменной и любым из ее наблюдаемых значений называется отклонением от среднего.

Среднеквадратическое отклонение – это корень из дисперсии.

Коэффициент вариации является показателем относительной изменчивости переменной. Он вычисляется и имеет смысл только для шкал равных отношений.

Размах вариации отражает разброс данных и уровень разности между наибольшим и наименьшим значением выборки.

Межквартильный размах – это разница между 75 и 25 межквартильными процентилями. Они охватывают центр. (25 50 75).

Медиана рассчитывается для порядковых шкал. Мода - для номинальных. Средняя арифметическая для интервальных шкал равных отношений. Все показатели вариации вычисляются только для интервальных шкал или шкал равных отношений.

Распределение в исследовании называется так потому, что казалось исследователям нормой.

Отклонения от нормы в распределении могут быть:

ü Асимметрия (распределение может смениться)

ü Для симметричного распределения медиана и мода совпадают, если они не совпадают, то оно асимметрично.

Эксцесс: вогнутый (отрицательный), выпуклый (положительный).

II. Выводной анализ

При помощи выводного анализа доказываем доверительность выводов, т.е. проанализировать все ошибки о достоверности выборки. Пишем о том, как необходимо поправить выборку. Считается величина ошибки. Делается вывод о емкости, спросе, нормах потребления.

Выводной анализ имеет 2 стороны:

1. Оценка параметров генеральной совокупности

2. Проверка гипотез

Оценка параметров генеральной совокупности, связана с тем, чтобы сравнить выборочную и фактическую совокупности. Здесь нам необходимо рассчитать все показатели в форме расчета ошибки выборки фактической.

µ_{фактич.} сравниваем с µ_{нормативной}.

µ_{нормативная}=0,05

Если µ_{фактич.}>5%, то необходимо ремонтировать выборку.

Ошибка выборки считается по опросу, по наблюдению (если оно было), коэффициент конкордации рассчитывается по экспертным опросам.

III. Анализ гипотез

При помощи анализа гипотез решаются вопросы, связанные с сегментацией:

ü Прямая (с помощью кластерного анализа обработка данных)

ü Косвенная (выдвигаем гипотезу, опровергаем, подтверждаем ее)

Доказательство гипотез выполняется с помощью статистических критериев.

Статистические критерии:

ü Параметрические– критерии, которые включают в формулу расчета параметры распределения (средние, дисперсии) шкала равных отношений, интервальная

ü Непараметрические – не включают в формулу расчета параметры распределения, они основываются на оперировании частотами, рангами.

Статистическая гипотеза – предложение о генеральной совокупности, которое можно проверить.

Гипотезы подразделяются на:

ü Нулевые и альтернативные

ü Направленные и не направленные

Нулевая гипотеза – гипотеза об отсутствии различии. Н_о нулевая, т.к. содержит число 0.

Н_о = х₁ – х₂ = 0

Следовательно, между ответами 1^ой группы и 2^ой группы, различия ответов не существенны.

Альтернативная гипотеза – гипотеза о значимости различий. Н₁ это то, что мы хотим доказать, если стоит задача доказательства значимости различий, или то, что мы хотим опровергнуть (экспериментальная гипотеза).

Н_ои Н₁

НаправленнаяНе направленная

Н₀: х₁ не превышает х₂Н₀: х₁ не отличается от х₂

Н₁: х₁превышает х₂Н₁: х₁отличается от х₂

Гипотезы всегда присутствуют при доказательстве эксперимента.

Проверка гипотезы – это статистическая процедура, применяемая для подтверждения или отклонения гипотезы, основанная на выборочных исследованиях.

Проверка гипотезы осуществляется на основе выявления согласованности эмпирических данных с гипотетическими. Если расхождения не выходит за пределы случайных ошибок, гипотезу принимают, при этом не делается ни каких заключений о правильности самой гипотезы.

Выполняется в 5 этапов:

Статистический критерий – это решающее правило, обеспечения принятия истинной и отклонение ложной гипотезы с высокой вероятностью. Обычно это правило содержит метод расчета определенного числа (формула, алгоритм), нормативное значение данного числа.

Среди непараметрических критериев различают 4 группы критериев:

1. Критерии различий - применяются для оценки различий, например между 2^мя, 3^мя сегментами. Показывают, что действительно есть различия, либо их нет.

ü Критерий Q – критерий Розенбаума

ü И – критерий Манна-Уитни

ü Н- критерий Крусколо-Уоллиса

2. Критерии изменений – применяются для доказательства того, что в результате каких либо действий произошли изменения (сдвиги) в измеряемых показателях.

ü G- критерий знаков

ü Т – критерий Вилкоксона

ü Х²_г – критерий Фридмена

ü L – критерий тенденций Пейджа

3. Критерии согласия распределений – применяются для доказательства гипотез по распределению признака

ü х² – критерий Пирсона

ü λ – критерий Колмогорова - Смирнова

4. Многофункциональные критерии – могут использоваться по отношению к самым разнообразным данным, выборкам и задачам.

ü φ^* – угловое преобразование Фишера

ü m – биноминальный критерий

Критерий Розенбаума – используется для оценки различий между двумя выборками по уровню какого либо признака количественного – измеренного, при чем, в каждой выборке должно быть не менее 11 испытуемых.

Критерий Манна – Уитни– для оценки различий между двумя выборками. Количество единиц в выборке больше или равно 3, или n₁=2, n₂≥5, то есть позволяет выявлять различия между малыми выборками, в каждой выборке должно быть не менее 3 наблюдений, не допускается, чтобы в одной выборке было 2, то во второй должно быть не менее 5. Мах число – не более 60 наблюдений, однако уже при 20 ранжирование проблематично.

Критерий Крусколо – Уоллиса – для оценки различий между 3^мя, 4^мя выборками одновременно по уровню, какого либо признака. Он позволяет установить, действительно ли уровень изменяется при переходе от одной группы к другой, но не указывает в какую сторону. Ограничения: если 3 выборки - допускается, чтобы в одной было 3 элемента, в 2^х других по 2, но значимость критерия может быть на самом низком уровне. Для того чтобы оказалось возможным диагностировать, необходимо, чтобы в каждой выборке было не менее 3^х, чтобы хотя бы в 1 из них было 4, а 2^х других – по 2.

Критерий знаков – предназначен для установления общего направления сдвига исследуемого признака, он позволяет установить, в какую сторону в выборке изменяется значение признака при переходе от 1 измерения (до рекламы) ко 2^му (после рекламы). Изменяются ли показатели в сторону улучшения, повышения или наоборот – ухудшения, ослабления. Количество наблюдений в обоих замерах должно быть не менее 5, но не более 300.

Критерий Вилкоксона – применяется для сопоставления показателей измеренных в 2^х разных условиях на одной и той же выборке. Позволяет установить не только направленность измерения, но и выраженность, т.е. с его помощью мы можем определить, является ли сдвиг показателей, в каком либо одном направлении более интенсивным, чем в другом. Минимальное количество испытуемых 5 человек, мах – 50 человек.

Критерий Фридмена –применяется для сопоставления показателей измеренных в 3^х или более условиях на одной и той же выборке. Позволяет установить, что показатель от условия к условию изменяется, но не позволяет понять направлений изменений. Ограничения: нижний порог не менее2^х испытуемых, каждый из них должен пройти не менее 3^х замеров, верхнего порога нет.

Критерий Пейджа - применяется для сопоставления показателей измеренных в 3^х или более условиях, на одной и той же выборке испытуемых и позволяет выявить тенденции в изменении величин признака при переходе от условия к условию. Его можно рассматривать, как продолжение теста Фридмена, поскольку он не только констатирует различия, но и указывает на направление изменений. Нижний порог как у Фридмена, верхний – 12 испытуемых и 6 замеров.

Критерий Пирсона– применяется:

1. для сопоставления эмпирического (фактического) распределения признака с теоретическим распределением

2. для сопоставления 2, 3^х и более эмпирических распределений и между собой. Применяются при объеме выборки более 30.

Критерий Колмогорова – Смирнова – применяется для сопоставления 2^х распределений – эмпирического с теоретическим, либо одного эмпирического, с одним теоретическим. Критерий позволяет найти точку, в которой сумма накопленных расхождений между 2^мя распределениями является наибольшей и оценить достоверность этого расхождения. Ограничения: критерий требует большой выборки. Если сравниваются 2 эмпирические выборки, то более 50. Эмпирическая и теоретическая – не менее 5.

Угловое преобразование Фишера – применяется для сравнения 2^х выборок по частоте встречаемости интересующего исследователя признака (частота посещения магазина). Критерий оценивает достоверность оценок 2^х выборок, в которой зарегистрирована интересующая нас группа.

Биноминальный критерий – предназначен для сопоставления частоты встречаемости, какого либо признака с теоретической или заданной частотой. Применяется, когда обследована одна выборка, объем не более 300 наблюдателей. Он позволяет оценить, насколько эмпирическая частота интересующего нас признака превышает теоретическую, среднестатистическую или какую либо заданную частоту.

Пример: критерий Розенбаума

2группы: в первой – 14 человек, в другой – 12 человек.

1 группа	2 группа
№	3 значения признака	№	3 значения признака

а) не совпадают б) совпадают в) частично совпадают

136

136 S₁=5

132 132

127 127

126 126

120

120 S₂=6

О_эм= S₁+ S₂ = 5 + 6 = 11

Критическое значение для n₁=14, n₂=12 при уровне значимости р<0,05, Q_крит= ; при р<0,01, Q_крит= 9. Чем больше расхождения между выборками, тем больше величина Q.

Сформулируем гипотезы:

Н_о: значение денежных сумм в сегменте А не превосходят значения денежных сумм в сегменте В.

Н₁: значение денежных сумм в сегменте А превосходят значения денежных сумм в сегменте В.

Н_о отклоняется, если Q_эмп ≥ Q_крит,а при Q_эмп < Q_крит, будем вынуждены применить Н_о.

У нас Q_эмп > Q_крит, следовательно гипотеза Н_о отклоняется, т.е. принято следующее: денежные суммы, затрачиваемые в сегменте А превосходят денежные суммы, затрачиваемые в сегменте В, со значимостью 0,01.

IV. Анализ связей

Анализ связей начинается с построения перекрестных таблиц. Они строятся по тем параметрам, по которым необходимо выявить наличие связи между двумя переменными (например, связь между доходом и нормой потребления).

Последовательность анализа включает следующие направления:

1. Проверка наличия или отсутствия связи между переменными.

2. Выявление формы связи (сила, вид, направление).

3. Оценка степени достоверности утверждения о наличии связи.

Методы, применяемые для анализа связей, отличаются в зависимости от следующих параметров:

1. от типа шкал, в которых оценены параметры;

2. от числа рассматриваемых переменных (зависимых и независимых).

⇐ Назад