Сегментация простыми словами

Карьерник — квиз-тренажёр в Telegram с 1500+ вопросами для собесов аналитика. SQL, Python, A/B, метрики. Бесплатно.

Короткое объяснение

Сегментация — разделение пользователей / клиентов на группы по общим характеристикам.

Зачем: потому что «средний пользователь» не существует. Разные группы ведут себя по-разному и требуют разных подходов.

Типы сегментации

1. Демографическая

По характеристикам человека:

  • Возраст, пол
  • Образование
  • Доход
  • Профессия

Слабее работает в продуктовой аналитике, чем в маркетинге.

2. Географическая

  • Страна, регион, город
  • Climate zone
  • Urban / rural

Важно для продуктов с региональной спецификой.

3. Поведенческая (самая полезная для продукта)

По действиям в продукте:

  • Частота использования
  • Глубина engagement
  • Купленные категории
  • Время использования

4. Психографическая

По ценностям, интересам:

  • Инноваторы vs консерваторы
  • Brand-loyal vs price-sensitive

Сложно измерить напрямую.

5. По ценности (RFM / LTV)

  • High-value (киты)
  • Mid-value
  • Low-value / new

Самая полезная для маркетинга и customer success.

RFM — классика сегментации

Recency — как давно была покупка Frequency — сколько покупок Monetary — общая сумма

Каждый пользователь получает rank по этим трём → 5×5×5 = 125 сегментов.

Упрощают до:

  • Champions: high R, F, M
  • Loyal: высокий F
  • At risk: давно не покупали (low R, high F, M)
  • Lost: давно не покупали, не много тратили

Подробнее: RFM анализ.

Методы сегментации

1. Rule-based

Вручную задаём правила:

-- «VIP клиент»
WHERE total_spent > 100000 AND last_purchase > NOW() - INTERVAL '30 days'

Плюс: понятно бизнесу. Минус: ригидно, не адаптивно.

2. ML clustering

K-means, DBSCAN, hierarchical clustering — автоматически находят группы.

Плюс: находит паттерны, которые вы не предполагали. Минус: «чёрный ящик», сложно объяснить.

3. Hybrid

Сначала ML предложит кластеры, потом analyst их интерпретирует и делает rule-based правила.

Как выбрать переменные для сегментации

Хорошие переменные:

  • Actionable: можем что-то сделать, зная сегмент
  • Stable: не меняется день-в-день
  • Meaningful: коррелирует с outcome (retention, revenue)
  • Measurable: данные доступны

Пример: сегментация e-commerce

Rule-based

  • New: зарегистрировались < 30 дней назад
  • Active: ≥ 1 заказ за 90 дней
  • At risk: последний заказ > 90 дней назад
  • Lost: нет заказов > 180 дней
  • VIP: top 10% по LTV

Каждому сегменту — своя стратегия (welcome, upsell, reactivation, win-back, loyalty).

Применение

1. Targeted marketing

Разные сообщения разным сегментам → выше CR.

2. Персонализация

Рекомендации товаров по сегменту.

3. Customer success

Больше внимания high-value сегменту.

4. Pricing

Разные тарифы для разных сегментов.

5. Product decisions

Какой сегмент пострадает от изменения?

Сегментация в A/B

Если эффект разный в сегментах — агрегированный результат может обмануть.

Пример:

  • Segment A: +5% CR (значимо)
  • Segment B: -3% CR (значимо)
  • Overall: +1% (не значимо)

Сегментация показывает реальный эффект.

Caveat: post-hoc сегментация — risk p-hacking. Pre-register сегменты.

Ошибки сегментации

1. Слишком много сегментов

20 сегментов = никакой сегментации. Никто не помнит, что делать с Segment #17.

2. Не actionable

Сегментация по hair color — невозможно использовать.

3. Overfit

ML даёт «идеальные» кластеры на train-данных, которые не стабильны на новых.

4. Static сегментация

Пользователи переходят между сегментами. Нужен re-segmentation регулярно.

5. Игнорировать малые сегменты

«Этот сегмент 1%» — но может генерировать 30% revenue.

Пример: когда сегментация важна

«Общий retention 20%. Что улучшить?»

Без сегментации — неясно.

С сегментацией:

  • New users: retention 10% ← здесь проблема
  • Old users: retention 40%

Проблема в onboarding → фокус на новых.

На собесе

«Что такое сегментация?» Разделение пользователей на группы по характеристикам.

«Какие виды?» Демографическая, географическая, поведенческая, RFM.

«Как выбрать переменные?» Actionable, stable, meaningful, measurable.

«Segmentation в A/B?» Может скрывать heterogeneous effect. Но post-hoc — риск p-hacking.

Связанные темы

FAQ

Сколько сегментов оптимально?

3-7 для action. Больше — рассеивает.

Rule-based или ML?

Начните с rule-based. ML — когда хотите найти неочевидные паттерны.

Сегментация vs cohort analysis?

Segmentation — по статической характеристике. Cohort — по времени контакта.

Как часто пересчитывать?

Monthly / quarterly. Пользователи меняют сегменты.


Тренируйте продуктовую аналитику — откройте тренажёр с 1500+ вопросами для собесов.