Сегментация пользователей — методы и примеры

Зачем сегментировать

Средние показатели врут. Средний чек 2 000 ₽ может означать, что половина покупает на 200 ₽, а другая — на 3 800 ₽. Средний retention 12% — это смесь из вовлечённого ядра с 40% и случайных визитёров с 2%. Без сегментации вы принимаете решения, глядя на кашу из разных пользователей.

Сегментация нужна для трёх вещей:

  • Персонализация. Разным сегментам — разные пуши, офферы, онбординг. Новичку не нужен промокод на повторную покупку, а churned-пользователю — приветственное письмо.
  • Таргетинг. Маркетинг работает эффективнее, когда вы знаете, кому именно показываете рекламу. Вместо одного оффера на всех — отдельная коммуникация для каждого сегмента.
  • Анализ. Без сегментов невозможно понять, почему метрика изменилась. Декомпозиция метрик начинается с разбивки на сегменты и анализа каждого по отдельности.

Типы сегментации

Поведенческая

Пользователей делят по действиям в продукте: частота визитов, глубина сессии, количество покупок, использование конкретных фич. Это самый полезный тип для продуктовой аналитики — он отражает реальное взаимодействие с продуктом, а не то, что пользователь о себе рассказал.

Примеры сегментов: power users (ежедневные визиты), casual users (раз в неделю), dormant (не заходил 30+ дней).

Демографическая

По характеристикам пользователя: возраст, пол, город, должность, размер компании. Полезна для B2B и маркетинга, но в продуктовой аналитике используется реже — демография плохо предсказывает поведение в продукте.

RFM

Классика сегментации клиентов: Recency (давность последней покупки), Frequency (частота), Monetary (сумма). Каждому клиенту присваивают баллы по трём осям и группируют в сегменты вроде Champions, At Risk, Lost. Подробный разбор с SQL — в гайде по RFM-анализу.

Когортная

Пользователей объединяют по времени привлечения (неделя или месяц регистрации) и сравнивают поведение когорт между собой. Это не совсем «сегментация» в классическом смысле — скорее метод анализа, но на собеседованиях их часто обсуждают вместе. Подробнее — в статье про когортный анализ.

По ценности (value-based)

Пользователей ранжируют по LTV или выручке и делят на группы: top 10%, средние, нижние. Помогает сфокусировать ресурсы — 80% выручки часто приходит от 20% клиентов.

SQL: сегментация по уровню активности

Классическая задача — разбить пользователей на сегменты по частоте действий за период. Здесь CASE WHEN — основной инструмент:

WITH user_activity AS (
    SELECT
        user_id,
        COUNT(*) AS events_30d
    FROM events
    WHERE created_at >= CURRENT_DATE - INTERVAL '30 days'
    GROUP BY user_id
)
SELECT
    user_id,
    events_30d,
    CASE
        WHEN events_30d >= 50 THEN 'Power User'
        WHEN events_30d >= 15 THEN 'Active'
        WHEN events_30d >= 3  THEN 'Casual'
        ELSE 'Dormant'
    END AS segment
FROM user_activity

SQL: сегментация по частоте покупок

WITH purchase_stats AS (
    SELECT
        user_id,
        COUNT(DISTINCT order_id) AS orders_count,
        SUM(amount)              AS total_revenue
    FROM orders
    WHERE order_date >= CURRENT_DATE - INTERVAL '6 months'
    GROUP BY user_id
)
SELECT
    segment,
    COUNT(*)                       AS users,
    ROUND(AVG(total_revenue), 0)   AS avg_revenue,
    ROUND(100.0 * COUNT(*) /
        SUM(COUNT(*)) OVER (), 1)  AS pct_of_users
FROM (
    SELECT
        user_id,
        total_revenue,
        CASE
            WHEN orders_count >= 10 THEN 'Loyal'
            WHEN orders_count >= 3  THEN 'Repeat'
            WHEN orders_count = 1   THEN 'One-time'
            ELSE 'No purchases'
        END AS segment
    FROM purchase_stats
) t
GROUP BY segment
ORDER BY avg_revenue DESC

Обратите внимание: запрос сразу считает размер и долю каждого сегмента — это первое, что нужно проверить после разбивки.

Фреймворк: как строить сегментацию

1. Выберите измерение. Что именно вы хотите понять? Если цель — увеличить retention, сегментируйте по активности. Если цель — увеличить выручку, используйте RFM или value-based.

2. Определите бакеты. Границы сегментов должны быть осмысленными для бизнеса. «Power User — 50+ событий» звучит разумно, но проверьте распределение: может, 50 событий — это 99-й перцентиль, и в сегменте окажется 12 человек.

3. Проверьте размеры. Хороший сегмент — от 5% до 40% базы. Если сегмент слишком маленький, он статистически незначим. Если слишком большой — бесполезен для таргетинга.

4. Проанализируйте. Для каждого сегмента посчитайте ключевые метрики: retention, конверсию, LTV, средний чек. Сегментация полезна ровно настолько, насколько сегменты различаются по метрикам.

5. Примените. Сегмент без действия — мёртвый вес. Для каждого сегмента должна быть гипотеза: что делать с этими пользователями.

Сегментация и A/B-тесты

Сегменты помогают A/B-тестам двумя способами:

Стратификация. Если в тестовую группу случайно попадёт больше Power Users, результат будет смещён. Стратификация — это балансировка групп по сегментам, чтобы в каждой группе была пропорциональная доля каждого сегмента.

Post-hoc анализ. Даже если A/B-тест показал +3% конверсии на всех, полезно проверить эффект по сегментам. Может оказаться, что фича работает только для новичков, а для лояльных — наоборот, ухудшает метрику.

Типичные ошибки

Слишком много сегментов. 15 сегментов — это не аналитика, это хаос. Команда не запомнит их, маркетинг не сделает 15 разных коммуникаций. 4-6 сегментов — оптимум.

Сегменты без действий. «Интересный инсайт: 23% пользователей заходят только по понедельникам». И что? Если сегмент не ведёт к решению, он бесполезен.

Пересекающиеся сегменты. Если пользователь может одновременно быть «Active» и «At Risk», система сломана. Сегменты должны быть взаимоисключающими (MECE).

Статичные границы при меняющемся продукте. Бакеты, заданные год назад, могут устареть. Пересматривайте границы при кратном росте базы или изменении бизнес-модели.

Вопросы с собеседований

Q: Как бы вы сегментировали пользователей мобильного приложения? A: Зависит от цели. Для retention — по частоте визитов за 30 дней (power/active/casual/dormant). Для монетизации — по RFM. Для анализа роста — когорты по неделе регистрации. Начал бы с поведенческой сегментации — она наиболее actionable.

Q: Напишите SQL, который разобьёт пользователей на сегменты по активности. A: CTE с подсчётом действий за период, затем CASE WHEN для разбивки на бакеты. Важно сразу посчитать размер каждого сегмента и проверить, что распределение адекватное. Пример — выше в статье.

Q: Чем поведенческая сегментация отличается от демографической? A: Поведенческая основана на действиях (клики, покупки, визиты), демографическая — на характеристиках (возраст, город). В продуктовой аналитике поведенческая полезнее — она показывает, что пользователь реально делает, а не кем он является.

Q: Сколько сегментов должно быть? A: 4-6 для операционного использования. Больше — сложно управлять, меньше — нет дифференциации. Каждый сегмент должен быть достаточно большим (5%+ базы) и различаться по ключевым метрикам.

Q: Как проверить, что сегментация хорошая? A: Три критерия. Первый — сегменты значительно различаются по целевой метрике (retention, LTV, конверсия). Второй — каждый сегмент достаточно велик для статистических выводов. Третий — для каждого сегмента есть actionable гипотеза.

FAQ

Какой тип сегментации самый частый на собеседованиях? Поведенческая и RFM. Поведенческую просят реализовать через CASE WHEN, RFM — через оконные функции и NTILE. Когортная тоже встречается, но её обычно спрашивают как отдельную тему.

Можно ли комбинировать типы сегментации? Да, и это часто делают. Например, сначала поведенческая (active/dormant), внутри каждого поведенческого сегмента — value-based (high/low revenue). Главное — не увлекаться: матрица 4×4 = 16 сегментов уже тяжело интерпретировать.

Как часто нужно обновлять сегменты? Зависит от динамики продукта. Для e-commerce — раз в неделю или месяц. Для SaaS — раз в месяц или квартал. Автоматизируйте пересчёт, чтобы сегменты не устаревали.


Потренируйте SQL-задачи на сегментацию и другие темы с собеседований аналитика — откройте тренажёр. 1500+ вопросов по SQL, продуктовой аналитике, A/B-тестам и статистике. Или посмотрите примеры вопросов.