Question 1

При сравнении двух сегментов по метрике вы заподозрили влияние конфаундера. Какой признак укажет, что речь действительно идёт о конфаундере, а не о другом эффекте?

Accepted Answer

Конфаундер искажает сравнение, потому что одновременно влияет и на формирование сегмента, и на результат. Например, регион может влиять на покупку и одновременно быть неравномерно распределённым между сегментами. Тогда разница метрики между сегментами будет отражать регион, а не реальный эффект интересующего фактора. Чтобы уменьшить искажение, используют контрольные переменные и стратификацию. Случайные ошибки измерения и разница в размере выборки — это другие проблемы, не сводящиеся к конфаундеру.

Question 2

Вы хотите понять, отличается ли конверсия между платформами iOS и Android. При этом трафик Android в основном идёт из регионов с низкой покупательной способностью. Какой подход наиболее корректен?

Accepted Answer

Для честного сравнения платформ нужно контролировать смешивающий фактор «регион» через стратификацию. Если регион влияет на покупки и распределён неравномерно между платформами, он искажает разницу метрик. Стратификация позволяет сравнить iOS и Android внутри одинаковых регионов, а затем собрать общий вывод с учётом весов. Это снижает риск перепутать эффект платформы с эффектом состава аудитории. Простое сравнение средних или искусственное перетасовывание пользователей в выборке такие смещения не лечит.

Question 3

Релиз новой посадочной страницы был в пятницу, а сравнение сделали между субботой и четвергом и увидели падение конверсии. Какой вероятный смешивающий фактор делает сравнение нечестным?

Accepted Answer

Разные дни недели могут быть сильным смешивающим фактором для продуктовых метрик. Даже без изменений продукта метрики часто отличаются между буднями и выходными. Если релиз совпал со сменой дня недели, вы не отделите эффект релиза от сезонности внутри недели. Корректнее сравнивать одинаковые дни или делать стратификацию по дню недели. Рандомизация и нулевой знаменатель — другие классы проблем и в этой ситуации не объясняют наблюдаемое падение.

Question 4

Маркетолог утверждает, что кампания B лучше: в B выше конверсия. Вы видите, что в B больше пользователей с десктопа, а на десктопе обычно базовая конверсия покупки выше. Какой ответ наиболее корректен на интервью?

Accepted Answer

Если состав аудитории по устройствам отличается, сравнение конверсий без контроля может быть искажено сдвигом микса и скрытыми факторами. Разные типы устройств часто имеют разную базовую конверсию и поведение пользователей. Если кампания приводит несопоставимую аудиторию, общая конверсия отражает смесь сегментов, а не качество кампании. Поэтому правильно зафиксировать тип устройства как контрольную переменную, сравнить like-for-like или провести стратификацию, и только потом делать вывод о реальной разнице между кампаниями.

Question 5

Новая функция включается кнопкой, и анализ показал, что у включивших выше удержание и конверсия. Какая основная проблема такого вывода?

Accepted Answer

При смещении отбора пользователи сами выбирают попадание в группу, и сравнение перестаёт быть честным без рандомизации или стратификации. Те, кто включает функцию, обычно более вовлечены и уже имеют более высокую базовую конверсию. Поэтому разница метрик может отражать не эффект функции, а различия аудитории. Чтобы оценить эффект, нужно сравнение без самоотбора, например через рандомизацию или через корректные контрольные переменные и стратификацию. Сезонность или сдвиг микса по регионам объясняют далеко не все случаи и не отменяют необходимости борьбы с самоотбором.

Сегментация и конфаундинг: вопросы для собеседования (часть 2)

Вопросы 6–10 из 20

Хотите тренировать интерактивно?

Другие темы: Логика