Question 1

Стейкхолдеры предлагают считать успех теста одновременно ростом конверсии, выручки и времени в приложении. Какой подход к метрикам наиболее здравый?

Accepted Answer

Чёткое разделение на основную, вторичные и защитные метрики помогает принимать решение без «метрического хаоса». Несколько основных метрик часто дают конфликтующие сигналы и повышают шанс выбрать победителя случайно. Лучше заранее договориться об одном решающем показателе, близком к цели продукта, например `OEC`. Остальные метрики полезны, но их роль должна быть определена заранее: диагностика (вторичные метрики) или ограничения рисков (защитные метрики). Постфактумный выбор метрики по `p-value` и «победа по любой метрике» — это `p-hacking` и почти гарантированно приведут к ложноположительным выводам.

Question 2

Вы тестируете купон: основной метрикой было «число заказов». Заказы выросли, но маржа заметно упала. Как корректнее пересобрать метрики на будущее?

Accepted Answer

Метрики должны отражать цель эксперимента и защищать бизнес через защитные метрики, иначе возможна «оптимизация не того». Купоны часто увеличивают количество заказов за счёт скидок, но ухудшают прибыльность. Если бизнес-цель — улучшить итоговую ценность, то основная метрика должна быть ближе к прибыли или марже, а заказы и средний чек полезнее как дополнительные. Дополнительно ставят защитные метрики, чтобы не допустить критического падения маржинальности или роста возвратов: средний чек сам по себе тоже легко обмануть скидочной механикой.

Question 3

Команда выбрала основной метрикой `CTR` по рекомендательным карточкам. В тесте `CTR` вырос, но продажи и выручка упали. Какой вывод наиболее вероятен?

Accepted Answer

Оптимизация по неверной основной метрике может улучшать клики, но ухудшать реальную ценность для продукта и бизнеса. Клики могут расти за счёт более агрессивных или «кликабельных» рекомендаций, которые не приводят к покупке. В таких случаях `CTR` лучше использовать как вторичную метрику, а основную метрику привязывать к конечной ценности — например, к покупке или выручке на пользователя. Это снижает риск «оптимизации не того» и метрик-ловушек.

Question 4

В целом конверсия в заказ выросла, но по разрезу RU/KZ видно падение в RU и рост в KZ, при этом доля трафика по странам между группами отличается. Что корректнее сделать дальше?

Accepted Answer

Эффект может быть искажён сдвигом состава аудитории, поэтому важно проверять сегменты и страховочные метрики по миксу. Агрегированный рост может возникнуть из-за того, что в одном варианте оказалось больше пользователей из сегмента с более высокой базовой конверсией. Это классический парадокс Симпсона: общий тренд противоречит трендам внутри сегментов. Практический шаг — проверить распределения по ключевым сегментам как страховочные метрики и разбирать результат по сегментам. Удаление страны или решение по общей цифре прячут реальный эффект и могут привести к ошибочному выкату.

Question 5

Вы тестируете ценовой баннер, но на неделе эксперимента прошла распродажа, сильно влияющая на конверсию. Что поможет корректнее оценить эффект с учётом сезонности и нормализации?

Accepted Answer

Контроль по тем же датам и нормализация помогают отделить эффект фичи от внешних событий и сезонности. Распродажа меняет поведение пользователей и базовый уровень конверсии, поэтому важно сравнивать варианты синхронно, а не с разными периодами. Нормализованные метрики снижают влияние колебаний трафика и активности. Дополнительно полезно смотреть динамику по дням, чтобы понять, не «рисует» ли эффект один особый день. Удаление дней только из тестовой группы или игнорирование распродажи приведёт к смещённой оценке.

Метрики и guardrail-метрики: вопросы для собеседования (часть 4)

Вопросы 16–20 из 20

Хотите тренировать интерактивно?

Другие темы: A/B-тесты