Question 1

Вы считаете `ARPU` в эксперименте; что является числителем и знаменателем этой метрики?

Accepted Answer

`ARPU` — это суммарная выручка, поделенная на число пользователей за период. Числитель `ARPU` — выручка, а знаменатель — количество пользователей, по которым вы нормируете выручку. Это делает метрику удобной для сравнения монетизации между вариантами. Важно, чтобы знаменатель соответствовал единице рандомизации, иначе интерпретация и дисперсия могут стать некорректными.

Question 2

Какая из метрик является метрикой-отношением (`ratio metric`)?

Accepted Answer

Метрика-отношение — это дробь двух величин, например кликов к показам у `CTR`. `CTR` зависит и от кликов (числителя), и от показов (знаменателя). Из-за этого метрика может меняться не только из-за поведения пользователей, но и из-за изменения экспозиции. Такие метрики требуют аккуратной агрегации и корректной оценки дисперсии.

Question 3

Есть таблица по пользователям с колонками `conversions` (число конверсий) и `visits` (число визитов). Вы хотите получить групповую конверсию по визитам. Какой расчёт корректен?

Accepted Answer

Групповая конверсия по визитам считается как отношение сумм: суммарные конверсии делятся на суммарные визиты. Простое среднее пользовательских долей `conversions / visits` отвечает на другой вопрос и переоценивает вклад пользователей с маленьким знаменателем. Отношение сумм автоматически учитывает разный вклад пользователей с разным числом визитов. Это ключевое отличие метрик-отношений от метрик-сумм, и именно отношение сумм соответствует «доле конверсий среди всех визитов в группе».

Question 4

Есть две кампании: первая — 1 клик и 1 показ, вторая — 9 кликов и 99 показов. Чему равен общий CTR по двум кампаниям при корректной агрегации?

Accepted Answer

Корректный общий CTR считается как сумма кликов, делённая на сумму показов, то есть это взвешенное по показам среднее. Если усреднить два CTR без весов, кампания с 1 показом получит тот же вес, что и кампания с 99 показами, и результат будет завышен. Правильная агрегация для доли на показ — это отношение сумм: (1+9)/(1+99) = 10%. По сути это взвешенное среднее CTR с весами, равными числу показов. Брать CTR только одной кампании или интерпретировать первую как 100% тоже неверно: данные второй кампании теряются.

Question 5

У каждого пользователя максимум одна конверсия, а метрика — доля пользователей с конверсией. Какой тест чаще всего уместен в базовом A/B при большом размере выборки?

Accepted Answer

Для доли бинарного события при больших n обычно подходит `z-test` (или `chi-square`) по пропорциям. Здесь метрика — доля пользователей с событием, а знаменатель фиксирован на уровне пользователей. При больших выборках нормальная аппроксимация для разницы долей работает хорошо, и тест считается быстро. `bootstrap` может использоваться как проверка, но часто не требуется для базового решения. Дельта-метод нужен для метрик-отношений с разным знаменателем, а `Mann–Whitney` — для непрерывных распределений, не для бинарных событий.

Вопросы по теме «Ratio-метрики и бутстреп»

Вопросы 1–5 из 20

Хотите тренировать интерактивно?

Другие темы: A/B-тесты