Question 1

Вы тестируете новую страницу товара; цель — увеличить покупки. Какая метрика наиболее логична как основная метрика для решения о запуске?

Accepted Answer

Основная метрика должна напрямую отражать цель эксперимента, а не промежуточные действия. Если продуктовая цель — покупки, то решающая метрика должна измерять именно покупку или шаг, максимально близкий к ней. Время на странице и скроллы могут быть полезными диагностическими показателями, но они легко растут из-за фрикции. Поэтому их уместнее держать как дополнительные, а конверсию в покупку — как основную метрику.

Question 2

Что в A/B-тесте обычно означает разделение на контрольную и тестовую группы?

Accepted Answer

Контроль и тест — это два варианта опыта, которые сравнивают при случайном распределении пользователей. В контрольной группе пользователи видят текущую версию продукта, а в тестовой — экспериментальное изменение. Ключевой принцип — рандомизация, чтобы группы были сопоставимы по составу. Сравнение разных месяцев или городов без рандомизации легко смешивает эффект фичи с внешними факторами, например с сезонностью.

Question 3

Какая формулировка лучше всего соответствует проверяемой гипотезе для A/B-теста?

Accepted Answer

Хорошая гипотеза связывает изменение с ожидаемым эффектом и явно называет основную и защитную метрики. Проверяемая гипотеза должна содержать: что меняем, для кого, какой ожидаем эффект и как именно его измеряем. Вариант с `purchase_conversion` и `refund_rate` задаёт и критерий успеха, и ограничение риска. Остальные варианты слишком расплывчаты: «удобнее», «увеличим выручку» и «улучшит все метрики» не фиксируют ни изменение, ни метрику, ни ожидаемый результат, и легко приводят к спорной интерпретации итогов теста.

Question 4

Вы смотрите результаты `A/B`-теста каждый день и останавливаете эксперимент, как только основная метрика стала «значимо лучше». Какой риск вы повышаете в первую очередь?

Accepted Answer

Подглядывание часто приводит к остановке на шуме и повышает шанс принять случайность за реальный эффект. Если многократно смотреть на метрику и принимать решение по первому удачному моменту, вероятность ошибочно «найти победителя» растёт. Это не обязательно связано с нарушением соотношения групп или сезонностью, а именно с процедурой принятия решения. Чтобы снизить риск, заранее фиксируют правило остановки или используют корректный последовательный подход к остановке.

Question 5

Какую проверку разумно сделать до обсуждения эффекта по основной метрике, чтобы быстрее поймать проблемы качества данных и `SRM`?

Accepted Answer

Проверки адекватности и поиск `SRM` помогают убедиться, что сравнение тестовой и контрольной групп корректно ещё до интерпретации эффекта. Даже хороший эксперимент может быть испорчен ошибкой назначения, фильтрами или логированием. Проверка размеров групп и базового состава по сегментам помогает заметить `SRM` и перекосы. Если такие проблемы есть, обсуждать эффект по основной метрике бессмысленно, пока не восстановлена валидность данных.

A/B-тесты в продуктовой аналитике: вопросы для собеседования (часть 2)

Вопросы 6–10 из 20

Хотите тренировать интерактивно?

Другие темы: Продуктовая аналитика