Вы считаете уникальных пользователей, воронку и удержание по device_id, но один человек может пользоваться двумя устройствами. Какое искажение наиболее вероятно?

AНикакого искажения не возникнет: device_id всегда соответствует ровно одному пользователю и подходит как идентификатор для расчёта когорт и удержания
BУникальные пользователи будут завышены: один человек может попасть в разные когорты, и пошаговая конверсия в воронке вместе с удержанием исказятся в сторону роста
CЭто приведёт только к сдвигу даты первого визита, но не повлияет на знаменатель в когортах и не исказит расчёт удержания и пошаговой конверсии в воронке
DНужно перейти на сырые события без какой-либо дедупликации по идентификатору, тогда проблема двух устройств одного пользователя автоматически исчезнет из расчётов
Правильный ответ. Неверный идентификатор пользователя завышает число уникальных пользователей, искажает когорты и расчёты удержания.

Разбор

Если один человек использует два значения device_id, то он будет посчитан как два разных пользователя. Это раздувает знаменатель, меняет размеры когорты и влияет на пошаговую конверсию и удержание. Для аналитики обычно используют единый идентификатор user_id или объединяют устройства в одного пользователя по правилам. Версии «никакого искажения», «только сдвиг даты» или «убрать дедупликацию» либо игнорируют проблему, либо ухудшают её, добавляя ещё больше шума в расчёты.

Проверь себя · 1/3разбор после ответа
Пользователь сделал 3 события view_product и 1 событие purchase за день. В воронке на уровне пользователей шаг 1 = view_product, шаг 2 = purchase. Как этот пользователь должен учитываться в расчёте конверсии шага?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Воронки и когортные рассуждения»