Question 1

В сегменте iOS конверсия выросла, и в сегменте Android тоже выросла, но общая конверсия по всем пользователям снизилась. Какое объяснение наиболее вероятно?

Accepted Answer

Противоречие между общим и сегментами часто объясняется сдвигом состава и изменением весов сегментов. Общая конверсия — это взвешенная комбинация сегментных значений. Если выросла доля сегмента с низким базовым уровнем, общий показатель может упасть даже при росте внутри каждого сегмента. Поэтому важно смотреть не только на значения в сегментах, но и на доли сегментов и делать сравнения на сопоставимых группах. Это типичный сдвиг состава, а не ошибка данных.

Question 2

Вы сравниваете удержание между регионами A и B. В регионе A больше пользователей из более «старых» когорт, а в регионе B — больше новых. Что корректнее сделать, чтобы сравнение было справедливым?

Accepted Answer

Разный состав когорт создаёт скрытый фактор, поэтому нужна стратификация для сравнения сопоставимых групп. Если «возраст когорты» влияет на удержание и распределён по регионам неравномерно, общий результат будет искажён скрытым фактором. Стратификация по возрасту когорты позволяет сравнивать сопоставимые группы пользователей, а затем корректно собрать общий вывод. Такой подход помогает отделить различие продукта от различий аудитории.

Question 3

Вы сравниваете ARPU между каналом A и каналом B и видите, что в канале A ARPU выше. При этом в канале A больше пользователей на iOS, которые обычно тратят больше. Что является вероятным смешивающим фактором и что нужно контролировать?

Accepted Answer

Разный состав по платформе может быть смешивающим фактором, который объясняет различие ARPU между каналами. Если платформа влияет на траты и распределена по каналам неравномерно, общий ARPU по каналу будет смесью с разными весами. Чтобы оценить эффективность канала, важно контролировать платформу через стратификацию или сравнение внутри сегментов. Тогда видно, есть ли разница в тратах именно из-за канала, а не из-за состава аудитории. Региона может вообще не быть в данных, а ARPU как отношение прекрасно «обманывается» сменой состава знаменателя — поэтому варианты с «контролировать только регион» или «ничего не контролировать» неверны.

Question 4

В каждом сегменте по устройству конверсия снизилась, но общая конверсия выросла. Что сначала нужно проверить, чтобы понять ситуацию?

Accepted Answer

Когда общий результат противоречит каждому сегменту, частая причина в сдвиге микса и изменении весов сегментов внутри общей выборки. Общий показатель является смесью сегментов, и изменение долей может привести к неожиданному результату. Поэтому важно смотреть не только значения внутри сегмента, но и распределение аудитории. После проверки сдвига микса полезно отчитать эффект на одинаковой структуре, чтобы сравнение было честным. Замена контрольной переменной или обвинение трекинга без проверки долей не объясняют парадокс.

Question 5

Пользователи сами решают, обновлять ли приложение. Вы сравнили конверсию у обновившихся и не обновившихся и получили лучший результат у новой версии. Что здесь самая большая аналитическая проблема?

Accepted Answer

Добровольное обновление создаёт смещение отбора, поэтому такое сравнение не даёт чистого эффекта новой версии. Обновившиеся пользователи могут отличаться по вовлечённости, базовой конверсии покупок и устройствам. Эти различия становятся смешивающим фактором и могут объяснить рост метрики без реального улучшения продукта. Чтобы оценить влияние версии, нужна рандомизация или хотя бы сравнение «равное к равному» с контролем ключевых факторов. Увеличение выборки или ссылка на сдвиг микса по устройствам сами по себе проблему самоотбора не решают.

Сегментация и конфаундинг: вопросы для собеседования (часть 3)

Вопросы 11–15 из 20

Хотите тренировать интерактивно?

Другие темы: Логика