Question 1

После редизайна главной страницы конверсия выросла по сравнению с прошлой неделей. Почему без A/B теста нельзя уверенно сказать, что рост вызван именно редизайном?

Accepted Answer

A/B тест нужен, чтобы оценить причинный эффект через сравнение контрольной и тестовой групп при рандомизации. Рост метрики после релиза может совпасть по времени с сезоном, маркетинговой кампанией или изменением аудитории. Без рандомизации нельзя корректно оценить контрфактический сценарий — что было бы, если бы редизайн не показывали. В A/B тесте группы формируются случайно, поэтому разница метрик лучше отражает причинный эффект изменения. Варианты про «всегда улучшают» и «доказывает причинность» опираются на неверные допущения.

Question 2

Какая пара гипотез корректна для двустороннего A/B-теста, где метрика — конверсия?

Accepted Answer

Обычно `H0` формулируют как отсутствие эффекта, а `H1` — как наличие отличий. В двустороннем тесте нас интересует любое изменение метрики, а не только рост или падение. Поэтому стандартно `H0` — равенство метрик в контрольной и тестовой группах. Альтернатива `H1` — метрики различаются, то есть эффект не равен нулю. Формулировки про «всегда выше» или конкретные численные эффекты не описывают пару гипотез корректно.

Question 3

Конверсия в контрольной группе 10%, в тестовой 11%. Как корректно описать абсолютный и относительный прирост?

Accepted Answer

Абсолютный прирост — разница в процентных пунктах, относительный — отношение разницы к базовой величине. Абсолютная разница: 11% − 10% = 1 процентный пункт. Относительный прирост считается относительно базы: (11% − 10%) / 10% = 10%. Эти два числа отвечают на разные вопросы и не должны путаться: первое описывает разницу в долях, второе — во сколько раз стало больше.

Question 4

Что в первую очередь даёт рандомизация в A/B-тесте?

Accepted Answer

Рандомизация делает назначение варианта независимым от свойств пользователя и поддерживает причинную интерпретацию. При случайном назначении вероятность попасть в контрольную или тестовую группу не зависит от поведения и характеристик пользователей. Это делает группы сопоставимыми и уменьшает влияние конфаундеров. Поэтому разница метрик между группами лучше интерпретируется как причинный эффект изменения. Идеального совпадения признаков рандомизация не обещает, пользователи в одном тесте обычно видят только один вариант, а знак прироста метрики не гарантирован.

Question 5

Вы включили новую функцию сначала только VIP-пользователям, и средний чек вырос. Почему это не доказывает, что функция увеличила чек?

Accepted Answer

Без случайного распределения групп нельзя отделить эффект изменения от различий между сегментами аудитории. Если новая функция показана только VIP, вы сравниваете не варианты продукта, а разные сегменты пользователей. VIP могут иметь другой чек и поведение даже без изменения, поэтому наблюдаемая разница не является причинной. A/B-тест с рандомизацией помогает избежать такого смещения, потому что назначение варианта не зависит от свойств пользователя. Утверждения «VIP менее активны», «A/B-тест не подходит для среднего чека» или «рост означает верность нулевой гипотезы» — неверны и не объясняют, почему наблюдение нельзя интерпретировать как эффект.

Основы A/B-тестирования: вопросы для собеседования (часть 3)

Вопросы 11–15 из 40

Хотите тренировать интерактивно?

Другие темы: A/B-тесты