В A/B тесте функция работает только у пользователей с новой версией приложения, а обновляются быстрее более активные пользователи. Что лучше проверить первым, чтобы понять риск смещения?

AСчитать, что рандомизация автоматически устраняет любые проблемы покрытия: состав групп по активности можно не сверять заранее
BСравнить итоговое p-value между группами без проверки состава: с активными и неактивными пользователями работаем одинаково
CСравнить состав выборки по активности и сегментам между вариантами и понять, какая аудитория попала в тестовую группу
DУдалить из анализа всех активных пользователей до сравнения: выравнивание по активности уберёт влияние нового обновления
Правильный ответ. Если попадание в тест зависит от поведения, возможно смещение отбора, и нужно проверить состав выборки между группами.

Разбор

Рандомизация работает только тогда, когда обе группы имеют доступ к функции одинаково. Если функция доступна только обновившимся, а активные обновляются быстрее — в тестовой группе систематически больше активных пользователей, и разница в метриках частично объясняется составом, а не эффектом фичи. Первый шаг — сравнить состав групп по активности, поведенческим сегментам, версии приложения и другим срезам, чтобы понять масштаб смещения. Прыгать сразу к p-value бессмысленно при подозрении на disbalance. Удаление активных пользователей выкинет нужную аудиторию и не решит проблему.

Проверь себя · 1/3разбор после ответа
Вы случайно отбираете для анализа не пользователей, а сессии (каждая сессия равновероятна попасть в выборку). Какой риск возникает для оценки среднего числа сессий на пользователя?
Тренировать статистику в Telegram

Ещё вопросы по теме «Выборка и смещение»