Сегментация пользователей — методы и примеры
Зачем сегментировать
Средние показатели врут. Средний чек 2 000 ₽ может означать, что половина покупает на 200 ₽, а другая — на 3 800 ₽. Средний retention 12% — это смесь из вовлечённого ядра с 40% и случайных визитёров с 2%. Без сегментации вы принимаете решения, глядя на кашу из разных пользователей.
Сегментация нужна для трёх вещей:
- Персонализация. Разным сегментам — разные пуши, офферы, онбординг. Новичку не нужен промокод на повторную покупку, а churned-пользователю — приветственное письмо.
- Таргетинг. Маркетинг работает эффективнее, когда вы знаете, кому именно показываете рекламу. Вместо одного оффера на всех — отдельная коммуникация для каждого сегмента.
- Анализ. Без сегментов невозможно понять, почему метрика изменилась. Декомпозиция метрик начинается с разбивки на сегменты и анализа каждого по отдельности.
Типы сегментации
Поведенческая
Пользователей делят по действиям в продукте: частота визитов, глубина сессии, количество покупок, использование конкретных фич. Это самый полезный тип для продуктовой аналитики — он отражает реальное взаимодействие с продуктом, а не то, что пользователь о себе рассказал.
Примеры сегментов: power users (ежедневные визиты), casual users (раз в неделю), dormant (не заходил 30+ дней).
Демографическая
По характеристикам пользователя: возраст, пол, город, должность, размер компании. Полезна для B2B и маркетинга, но в продуктовой аналитике используется реже — демография плохо предсказывает поведение в продукте.
RFM
Классика сегментации клиентов: Recency (давность последней покупки), Frequency (частота), Monetary (сумма). Каждому клиенту присваивают баллы по трём осям и группируют в сегменты вроде Champions, At Risk, Lost. Подробный разбор с SQL — в гайде по RFM-анализу.
Когортная
Пользователей объединяют по времени привлечения (неделя или месяц регистрации) и сравнивают поведение когорт между собой. Это не совсем «сегментация» в классическом смысле — скорее метод анализа, но на собеседованиях их часто обсуждают вместе. Подробнее — в статье про когортный анализ.
По ценности (value-based)
Пользователей ранжируют по LTV или выручке и делят на группы: top 10%, средние, нижние. Помогает сфокусировать ресурсы — 80% выручки часто приходит от 20% клиентов.
SQL: сегментация по уровню активности
Классическая задача — разбить пользователей на сегменты по частоте действий за период. Здесь CASE WHEN — основной инструмент:
WITH user_activity AS (
SELECT
user_id,
COUNT(*) AS events_30d
FROM events
WHERE created_at >= CURRENT_DATE - INTERVAL '30 days'
GROUP BY user_id
)
SELECT
user_id,
events_30d,
CASE
WHEN events_30d >= 50 THEN 'Power User'
WHEN events_30d >= 15 THEN 'Active'
WHEN events_30d >= 3 THEN 'Casual'
ELSE 'Dormant'
END AS segment
FROM user_activitySQL: сегментация по частоте покупок
WITH purchase_stats AS (
SELECT
user_id,
COUNT(DISTINCT order_id) AS orders_count,
SUM(amount) AS total_revenue
FROM orders
WHERE order_date >= CURRENT_DATE - INTERVAL '6 months'
GROUP BY user_id
)
SELECT
segment,
COUNT(*) AS users,
ROUND(AVG(total_revenue), 0) AS avg_revenue,
ROUND(100.0 * COUNT(*) /
SUM(COUNT(*)) OVER (), 1) AS pct_of_users
FROM (
SELECT
user_id,
total_revenue,
CASE
WHEN orders_count >= 10 THEN 'Loyal'
WHEN orders_count >= 3 THEN 'Repeat'
WHEN orders_count = 1 THEN 'One-time'
ELSE 'No purchases'
END AS segment
FROM purchase_stats
) t
GROUP BY segment
ORDER BY avg_revenue DESCОбратите внимание: запрос сразу считает размер и долю каждого сегмента — это первое, что нужно проверить после разбивки.
Фреймворк: как строить сегментацию
1. Выберите измерение. Что именно вы хотите понять? Если цель — увеличить retention, сегментируйте по активности. Если цель — увеличить выручку, используйте RFM или value-based.
2. Определите бакеты. Границы сегментов должны быть осмысленными для бизнеса. «Power User — 50+ событий» звучит разумно, но проверьте распределение: может, 50 событий — это 99-й перцентиль, и в сегменте окажется 12 человек.
3. Проверьте размеры. Хороший сегмент — от 5% до 40% базы. Если сегмент слишком маленький, он статистически незначим. Если слишком большой — бесполезен для таргетинга.
4. Проанализируйте. Для каждого сегмента посчитайте ключевые метрики: retention, конверсию, LTV, средний чек. Сегментация полезна ровно настолько, насколько сегменты различаются по метрикам.
5. Примените. Сегмент без действия — мёртвый вес. Для каждого сегмента должна быть гипотеза: что делать с этими пользователями.
Сегментация и A/B-тесты
Сегменты помогают A/B-тестам двумя способами:
Стратификация. Если в тестовую группу случайно попадёт больше Power Users, результат будет смещён. Стратификация — это балансировка групп по сегментам, чтобы в каждой группе была пропорциональная доля каждого сегмента.
Post-hoc анализ. Даже если A/B-тест показал +3% конверсии на всех, полезно проверить эффект по сегментам. Может оказаться, что фича работает только для новичков, а для лояльных — наоборот, ухудшает метрику.
Типичные ошибки
Слишком много сегментов. 15 сегментов — это не аналитика, это хаос. Команда не запомнит их, маркетинг не сделает 15 разных коммуникаций. 4-6 сегментов — оптимум.
Сегменты без действий. «Интересный инсайт: 23% пользователей заходят только по понедельникам». И что? Если сегмент не ведёт к решению, он бесполезен.
Пересекающиеся сегменты. Если пользователь может одновременно быть «Active» и «At Risk», система сломана. Сегменты должны быть взаимоисключающими (MECE).
Статичные границы при меняющемся продукте. Бакеты, заданные год назад, могут устареть. Пересматривайте границы при кратном росте базы или изменении бизнес-модели.
Вопросы с собеседований
Q: Как бы вы сегментировали пользователей мобильного приложения? A: Зависит от цели. Для retention — по частоте визитов за 30 дней (power/active/casual/dormant). Для монетизации — по RFM. Для анализа роста — когорты по неделе регистрации. Начал бы с поведенческой сегментации — она наиболее actionable.
Q: Напишите SQL, который разобьёт пользователей на сегменты по активности. A: CTE с подсчётом действий за период, затем CASE WHEN для разбивки на бакеты. Важно сразу посчитать размер каждого сегмента и проверить, что распределение адекватное. Пример — выше в статье.
Q: Чем поведенческая сегментация отличается от демографической? A: Поведенческая основана на действиях (клики, покупки, визиты), демографическая — на характеристиках (возраст, город). В продуктовой аналитике поведенческая полезнее — она показывает, что пользователь реально делает, а не кем он является.
Q: Сколько сегментов должно быть? A: 4-6 для операционного использования. Больше — сложно управлять, меньше — нет дифференциации. Каждый сегмент должен быть достаточно большим (5%+ базы) и различаться по ключевым метрикам.
Q: Как проверить, что сегментация хорошая? A: Три критерия. Первый — сегменты значительно различаются по целевой метрике (retention, LTV, конверсия). Второй — каждый сегмент достаточно велик для статистических выводов. Третий — для каждого сегмента есть actionable гипотеза.
FAQ
Какой тип сегментации самый частый на собеседованиях? Поведенческая и RFM. Поведенческую просят реализовать через CASE WHEN, RFM — через оконные функции и NTILE. Когортная тоже встречается, но её обычно спрашивают как отдельную тему.
Можно ли комбинировать типы сегментации? Да, и это часто делают. Например, сначала поведенческая (active/dormant), внутри каждого поведенческого сегмента — value-based (high/low revenue). Главное — не увлекаться: матрица 4×4 = 16 сегментов уже тяжело интерпретировать.
Как часто нужно обновлять сегменты? Зависит от динамики продукта. Для e-commerce — раз в неделю или месяц. Для SaaS — раз в месяц или квартал. Автоматизируйте пересчёт, чтобы сегменты не устаревали.
Потренируйте SQL-задачи на сегментацию и другие темы с собеседований аналитика — откройте тренажёр. 1500+ вопросов по SQL, продуктовой аналитике, A/B-тестам и статистике. Или посмотрите примеры вопросов.