В A/B тесте функция работает только у пользователей с новой версией приложения, а обновляются быстрее более активные пользователи. Что лучше проверить первым, чтобы понять риск смещения?
AСчитать, что рандомизация автоматически устраняет любые проблемы покрытия: состав групп по активности можно не сверять заранее
BСравнить итоговое
p-value между группами без проверки состава: с активными и неактивными пользователями работаем одинаковоCСравнить состав выборки по активности и сегментам между вариантами и понять, какая аудитория попала в тестовую группу
DУдалить из анализа всех активных пользователей до сравнения: выравнивание по активности уберёт влияние нового обновления
Правильный ответ. Если попадание в тест зависит от поведения, возможно смещение отбора, и нужно проверить состав выборки между группами.
Разбор
Рандомизация работает только тогда, когда обе группы имеют доступ к функции одинаково. Если функция доступна только обновившимся, а активные обновляются быстрее — в тестовой группе систематически больше активных пользователей, и разница в метриках частично объясняется составом, а не эффектом фичи. Первый шаг — сравнить состав групп по активности, поведенческим сегментам, версии приложения и другим срезам, чтобы понять масштаб смещения. Прыгать сразу к p-value бессмысленно при подозрении на disbalance. Удаление активных пользователей выкинет нужную аудиторию и не решит проблему.
Проверь себя · 1/3разбор после ответа
Вы случайно отбираете для анализа не пользователей, а сессии (каждая сессия равновероятна попасть в выборку). Какой риск возникает для оценки среднего числа сессий на пользователя?
Ещё вопросы по теме «Выборка и смещение»
- Вы хотите оценить средний чек за неделю для всех пользователей продукта. У вас есть данные по 5% пользователей, отобранных случайно. Что в этой задаче является генеральной совокупностью?
- Вы измерили NPS только у iOS-пользователей через опрос внутри приложения и хотите распространить результат на всех пользователей. Какой риск здесь ключевой?
- Вы выложили ссылку на опрос в соцсетях и получили ответы в основном от людей с сильным недовольством продуктом. Какое смещение наиболее вероятно?
- Аналитик посчитал средний доход на пользователя только среди тех, кто остался активным до 30-го дня, и сделал вывод о среднем доходе всех новичков. Какое смещение здесь наиболее характерно?
- В опросе пользователи систематически занижают свой доход. Как лучше всего описать проблему в терминах качества данных?
- Все вопросы по «Выборка и смещение» →