Question 1

Вы сравниваете конверсию между каналом «поиск» и каналом «соцсети». В канале «поиск» заметно больше пользователей из регионов с высокой платежеспособностью. Какой наиболее вероятный смешивающий фактор и что логично использовать как контрольную переменную?

Accepted Answer

Если разные группы трафика имеют разный состав по регионам, то регион становится вероятным смешивающим фактором. При сравнении каналов аудитория может отличаться по платежеспособности и доступности ассортимента. Если регион связан и с выбором канала, и с покупкой, он искажает сравнение. Корректнее сделать стратификацию по региону или сравнивать каналы внутри одинаковых регионов на одинаковых сегментах.

Question 2

После релиза новой версии приложения общая конверсия упала. При этом выросла доля трафика на Android, у которого исторически ниже базовый уровень конверсии. Какое объяснение наиболее правдоподобно без дополнительных данных?

Accepted Answer

Падение общего показателя может быть следствием смены структуры аудитории, а не ухудшения внутри каждого сегмента. Если доля сегмента с более низким базовым уровнем выросла, общая конверсия может снизиться даже при стабильности внутри сегментов. Это частая ситуация, когда меняется состав по платформам или источникам трафика. Чтобы проверить, нужно сравнить метрику на сопоставимых данных — посчитать конверсию отдельно по каждому сегменту и посмотреть изменения внутри. Утверждения «всегда ухудшилось во всех сегментах», «при рандомизации это невозможно» или «контролировать только устройство» игнорируют сам механизм смены структуры аудитории.

Question 3

Вы хотите сравнить конверсию между iOS и Android, но подозреваете, что в iOS больше трафика из канала email. Какой способ контроля смешивающего фактора наиболее корректен?

Accepted Answer

Чтобы сравнение было честным, нужно контролировать смешивающий фактор через стратификацию по каналу и сравнение iOS/Android внутри одного канала. Если канал влияет на вероятность покупки и распределён по платформам неодинаково, он искажает прямое сравнение. Корректный подход — сравнивать iOS и Android внутри одного и того же канала, а затем агрегировать результаты с учётом весов. Сравнение только общей конверсии маскирует сдвиг состава трафика, а выбор «лучшего» сегмента превращает наблюдение в подтасовку. Искусственное добавление трафика на одну платформу не решает задачу контроля и создаёт новые искажения.

Question 4

После запуска нового платного канала средняя длительность сессии упала. При этом внутри органического канала и внутри платного длительность почти не изменилась. Какое объяснение наиболее логичное?

Accepted Answer

Если внутри сегмента метрика стабильна, а общий уровень меняется, частая причина — смещение состава. Общий показатель является смесью сегментных значений с весами, равными долям сегментов. Когда доли меняются, общий результат может измениться даже без изменений внутри сегментов. Поэтому важно мониторить состав аудитории и смотреть метрики на сопоставимом составе по сегменту. Объявлять это ошибкой инструментирования или отказываться от сегментации — значит терять контекст вместо того, чтобы его учитывать.

Question 5

Маркетинг сравнивает конверсию двух лендингов. Вариант A чаще показывали пользователям из регионов с высоким спросом, вариант B — из других регионов. Как корректнее всего контролировать этот фактор в анализе?

Accepted Answer

Если варианты показаны разной аудитории, нужен контроль состава через стратификацию. Разные регионы часто имеют разную базовую конверсию, поэтому сравнение без контроля состава будет искажено. Стратификация позволяет сравнить варианты внутри одинакового региона и отделить влияние состава от влияния лендинга. После этого можно агрегировать вывод с общими весами, сохраняя прозрачность по сегментам. Удаление регионов и сравнение по одному сегменту смещают выводы и теряют общую картину.

Вопросы по теме «Сегментация и конфаундинг»

Вопросы 1–5 из 20

Хотите тренировать интерактивно?

Другие темы: Логика