Question 1

Вы хотите оценить долю пользователей, которые сначала сделали поиск, а затем покупку в течение недели — независимо от количества сессий. Какую логику воронки лучше выбрать?

Accepted Answer

Если вопрос про долю людей, считайте воронку на уровне пользователей по уникальным пользователям с дедупликацией на каждом шаге. Подсчёт по событиям отвечает на другой вопрос: сколько покупок приходится на количество поисков, и легко искажается частотой действий активных пользователей. Подсчёт по сессиям тоже меняет смысл: один и тот же человек в разных сессиях учитывается несколько раз. Воронка на уровне пользователей делает показатель вероятностным: был ли поиск и была ли покупка у конкретного человека. Это и соответствует формулировке про долю пользователей.

Question 2

В расчёте удержания первого дня (D1 retention) по уникальным пользователям человек открыл приложение 20 раз в день 1. Как он учитывается в числителе?

Accepted Answer

В удержании считают уникальных пользователей, а не события, поэтому в числителе нужна дедупликация по дню. Для удержания первого дня важно, вернулся ли пользователь хотя бы один раз. Двадцать открытий приложения всё равно означают одного вернувшегося уникального пользователя. Поэтому в числителе он учитывается как 1, а не как 20. Событийный счёт здесь исказил бы метрику, делая её зависимой от частоты открытия, а не от факта возврата.

Question 3

В оформлении заказа есть два пути: `add_to_cart` и `buy_now`, оба ведут к `purchase`. В воронке шаг 2 задан только как `add_to_cart`, и конверсия выглядит низкой. Что лучше сделать?

Accepted Answer

Шаги воронки должны отражать реальные пути, иначе знаменатель и потери по шагам искажаются. Если часть пользователей покупает через `buy_now`, они не обязаны проходить `add_to_cart`. Тогда шаг 2 становится не универсальным, и конверсия выглядит хуже, чем есть на самом деле. Решение — определить шаг через общий смысл (например, `start_checkout`) или разнести пути в две отдельные воронки. Так получится честно понять, где теряются пользователи и какой путь эффективнее.

Question 4

Вы строите когорту покупателей для удержания, где день 0 — первая покупка. Как правильно определить дату когорты для пользователя?

Accepted Answer

Для когорты покупки дата когорты равна первой покупке пользователя, чтобы он не попадал в когорты повторно. Если день 0 — первая покупка, базой служит момент первой покупки для каждого пользователя; нужна дедупликация и выбор минимальной даты события. Если использовать последнюю покупку, возраст пользователя сместится и кривая удержания исказится. Если разрешить попадание в несколько когорт, сравнения между когортами станут некорректными.

Question 5

Аналитик считает удержание так: берёт всех уникальных пользователей, активных на неделе 1, и делит число активных на неделе 2 на эту базу. Почему это может быть ошибкой, если нужна когортная логика?

Accepted Answer

Для когортного удержания база должна быть фиксированной когортой, иначе вы смешиваете пользователей разного возраста. Если каждый раз брать активных за неделю, состав базы меняется и включает пользователей, пришедших в продукт в разные даты. Такой показатель ближе к общей повторной активности, а не к когортному удержанию. Для когортного анализа нужно зафиксировать дату когорты (например, первое событие `signup`) и дальше смотреть возвраты по возрасту: удержание `W1`, `W2` и так далее. Тогда сравнения между когортами будут честными.

Воронки, когорты и retention: вопросы для собеседования (часть 3)

Вопросы 11–15 из 20

Хотите тренировать интерактивно?

Другие темы: Продуктовая аналитика