Question 1

Команда запустила новый дизайн карточки товара в A/B-тесте. В первые три дня конверсия в тестовой группе на 15% выше, но к концу второй недели разница упала до 2%. Как грамотно учесть эффект новизны?

Accepted Answer

Эффект новизны — временный рост метрик из-за любопытства пользователей к новому интерфейсу. Эффект новизны (novelty effect) возникает, когда пользователи активнее взаимодействуют с изменением просто потому, что оно новое. Через одну-две недели поведение стабилизируется. Грамотный подход — дождаться этой стабилизации и анализировать данные за устойчивый период. Принимать решение по первым дням опасно: эффект может полностью исчезнуть.

Question 2

Компания тестирует новый дашборд для менеджеров по продажам. Тестовой группе сообщили, что они участвуют в эксперименте по повышению эффективности. Продажи в тестовой группе выросли на 12%. Что может искажать результат?

Accepted Answer

Хоторнский эффект: люди меняют поведение, когда знают, что за ними наблюдают. Хоторнский эффект (Hawthorne effect) — изменение поведения участников из-за осознания того, что они находятся под наблюдением. Менеджеры могли стараться сильнее не благодаря дашборду, а потому что знали об эксперименте. В идеале участники не должны знать о своём участии в тесте. Если это невозможно — контрольной группе тоже сообщают об «эксперименте» (плацебо-контроль).

Question 3

Перед запуском серии A/B-тестов команда решила провести AA-тест: разделить пользователей на две группы, но обеим показать одну и ту же версию продукта. Зачем это нужно?

Accepted Answer

AA-тест проверяет, что система сплитования работает корректно и не вносит систематических различий между группами. В AA-тесте обе группы получают одинаковое воздействие. Если метрики статистически значимо отличаются — значит, в системе рандомизации есть баг, данные собираются с ошибкой или есть систематическое смещение. Обнаружить такую проблему до запуска реального теста критически важно, иначе все результаты будут недостоверными.

Question 4

В A/B-тесте новой кнопки оплаты часть пользователей получает обновлённый интерфейс, а остальные — старый. Что в такой постановке принято называть группой `treatment`?

Accepted Answer

`treatment` — это группа, которой показывают тестируемое изменение, и именно её сравнивают с `control` для оценки эффекта. В терминологии экспериментов `control` получает текущий опыт, а `treatment` — новую версию или новое правило. Сравнение метрик между ними и даёт оценку эффекта изменения. Группа со старой версией — это `control`, а не `treatment`. Намеренное занижение размера выборки или отказ от измерения метрики не определяют сути группы и просто ломают статистику теста.

Question 5

Вы тестируете новый текст кнопки оплаты. Что должно быть верно для корректного сравнения контрольной и тестовой группы?

Accepted Answer

В корректном эксперименте контрольная и тестовая группы должны отличаться только тестируемым фактором. Если вместе с текстом поменять ещё что-то, станет непонятно, что именно вызвало разницу в метриках. Поэтому в контрольной группе оставляют текущий опыт, а в тестовой вводят ровно одно изменение. Состав пользователей, наоборот, должен быть как можно более похожим — это обеспечивает рандомизация. И метрику нужно считать в обеих группах, иначе сравнивать будет не с чем.

Вопросы по теме «Основы A/B-тестирования»

Вопросы 1–5 из 40

Хотите тренировать интерактивно?

Другие темы: A/B-тесты