RFM-анализ
RFM (Recency, Frequency, Monetary)-anajиз чаще всего используется для изучения товарного ассортимента по частоте обращений, а также его применяют для классификации клиентов. Шаблон RFM-анализа представлен в табл. 6.3.
Основу RFM-анализа составляют следующие характеристики:
• Recency (новизна) – новизна какого-либо события. Чем меньше времени прошло с момента последней активности клиента (последней продажи товара), тем более вероятно, что действие повторится;
• Frequency (частота ши количество) – количество покупок, которые совершил клиент (количество продаж). Чем их больше, тем выше вероятность того, что клиент повторит действия в будущем. Данный параметр рассматривается за определенный промежуток времени (неделя, месяц, квартал, год и т.д.);
• Monetary (деньги) – сумма, которую потратил клиент (выручка от продажи товара). Чем больше потраченная сумма, тем выше вероятность того, что клиент повторит заказ.
Таблица 6.3
Шаблон RFM-анализа
Контрагент |
Recency |
Frequency |
Monetary |
Последняя продажа |
Количество продаж |
Денежная ценность |
Простейший метод RFM-анализа состоит из следующих шагов.
1. Все наблюдения последних продаж сортируют по возрастанию. После сортировки все данные делятся на пять равных частей: в первый квинтиль попадают наиболее "свежие" клиенты, во вто-
рой – вторые по давности последнего заказа и т.д. Каждый квинтиль кодируется. Код 5 присваивают самому "свежему" квинтилю, код 4 – второму по давности последнего заказа группе и т.д.
Последняя продажа |
R |
N/5 |
5 |
N/5 |
4 |
N/5 |
3 |
N/5 |
2 |
N/5 |
1 |
2. Аналогичная сортировка проводится для контрагентов. После сортировки файл данных делится на пять равных частей: в первый квинтиль попадают клиенты, сделавшие наименьшее количество заказов, во второй – вторые по количеству заказов и т.д. Каждый квинтиль кодируется. Код 1 присваивают самому "слабому" с точки зрения количества заказов квинтилю, код 2 – второму по количеству заказов группе и т.д.
Количество продаж |
F |
N/5 |
1 |
N/5 |
2 |
N/5 |
3 |
N/5 |
4 |
N/5 |
5 |
3. Ранжируют клиентов по денежной ценности (выручке от продаж), делят клиентов на пять равных частей: в первый квинтиль попадают клиенты, потратившие наименьшее количество средств, во второй – вторые по количеству истраченных денег и т.д. Каждый квинтиль кодируется. Код 1 присваивают самому "слабому" с точки зрения потраченных денег квинтилю, код 2 – второму по количеству денег группе и т.д.
Денежная ценность |
М |
N/5 |
1 |
N/5 |
2 |
N/5 |
3 |
N/5 |
4 |
N/5 |
5 |
Всевозможные комбинации кодов RFM дают 125 сегментов, как показано на рис. 6.7, где 555 заранее является наилучшим сегментом, 111 – наихудшим.
Рис. 6.7. Конструкция выбора RFM-кода
На практике Monetary обычно не используют, так как данная характеристика сильно коррелирует с Frequency, поэтому RFM-анализ часто упрощают до RF-сегментации (рис. 6.8).
Рис. 6.8. Пример RF-анализа
Если объединить параметры в один параметр RF, то точность прогноза, по мнению аналитиков, повышается в несколько раз [6]. По методике Джино Ново, можно использовать такую последовательность анализа:
• параметр R – разбивается на пять частей, и появляются пять значений от 1 до 5,5 – это когда заказ был сделан совсем недавно;
• параметр F – разбивается на пять частей, и появляются пять значений от 1 до 5,5 – это когда клиент сделал в течение определенного периода времени (этот период тоже нужно рассчитать) очень много заказов;
• строится RF-сетка (grid) в виде двухзначной комбинации R и F; 55 – сегмент лучших клиентов, 11 – самых худших клиентов;
• вычисляются transformation rates для каждого сегмента;
• 25 ДЕ-сегментов объединяются по transformation rates в большие сегменты.
Получается, что каждый заказчик может иметь свое значение RF, а следовательно, и свою вероятность для планирования и прогнозирования.