Вопросы по теме «Доли и проценты»

Процентное изменение, процентные пункты, доля от целого, парадокс Симпсона — арифметика долей полна ловушек. На собеседовании часто спрашивают: «конверсия выросла с 2% до 3% — это рост на 1% или на 50%?» Путаница между процентами и процентными пунктами — красный флаг для интервьюера.

Всего в этом разделе 20 вопросов. Каждый — с правильным ответом и кратким разбором теории. Разбито на 4 части по 5 вопросов.

Булева логика и фильтрыКачество данных и инвариантыВоронки и когортные рассужденияJOIN и кардинальностьПостановка задачиSanity-check и оценкаСегментация и конфаундингТеория множеств и дедупликацияВзвешенные средние и смешение

Вопросы 15 из 20

1В сервисе мониторят `error rate` для API. Что логичнее использовать как `denominator` для этой `ratio metric`?
A`errors` / `users`
B`errors` / `sessions`
C`requests` / `errors`
D`errors` / `requests`
Ответ: Для `error rate` корректный `denominator` — `requests`, потому что ошибки возможны на каждом запросе.

Если база — `requests`, `rate` отвечает на вопрос, какая доля запросов заканчивается ошибкой. При `users` или `sessions` вы смешиваете нагрузку и поведение пользователей с качеством API. Правильный `denominator` делает сравнение релизов и периодов более честным.

2В отчёте по баннеру нужно посчитать `CTR`. Какой `denominator` корректен для этой `ratio metric`?
A`clicks` / `impressions`
B`clicks` / `sessions`
C`impressions` / `clicks`
D`clicks` / `users`
Ответ: Для `CTR` корректный `denominator` — `impressions`, а числитель — `clicks`.

`CTR` измеряет, какая доля показов приводит к клику, поэтому база должна отражать экспозицию. Если заменить `denominator` на `sessions` или `users`, вы получите другую `ratio metric` и перестанете сравнивать одно и то же. Правильный выбор базы делает сравнения между креативами и периодами честными.

3Команда считает `7-day retention`: в день 0 было 1000 новых `users`, за 7 дней вернулось 300 уникальных `users`. Какой `denominator` корректен для `retention rate`?
AСуммарные `sessions` за 7 дней
BЧисло вернувшихся `users` (300), потому что это главный результат
CЧисло новых `users` в день 0 (1000)
DЧисло `DAU` за неделю
Ответ: Для `retention rate` `denominator` обычно равен размеру исходной когорты, чтобы база сравнения была стабильной.

`Retention` отвечает на вопрос, какая доля когорты вернулась, поэтому база — это те, кто был в когорте на старте. Если подменить `denominator` на `DAU` или `sessions`, вы получите другую метрику, и сравнение перестанет быть когортным. Стабильный `denominator` делает сравнение периодов корректным.

4Метрика `CR` выросла с 2% до 3%. Какое утверждение корректно описывает изменение?
AРост на 1% и одновременно на 1 процентный пункт
BРост на 1 процентный пункт и на 50% относительно `base rate`
CРост на 50 процентных пунктов
DРост на 3%, потому что новое значение равно 3%
Ответ: Переход `CR` с 2% до 3% означает +1 процентный пункт и +50% относительно `base rate`.

Изменение в процентных пунктах — это абсолютная разница между двумя долями. Относительный рост в процентах считается относительно `base rate`, поэтому при маленькой базе он выглядит большим. Важно явно говорить, о каком типе изменения идёт речь, чтобы не вводить бизнес в заблуждение.

5Кампания A: 200 новых `users`, за 7 дней вернулось 40 `users`. Кампания B: 50 новых `users`, за 7 дней вернулось 15 `users`. Как корректнее сравнить `retention` между кампаниями?
AСравнить только число вернувшихся `users`: 40 против 15
BСравнить только число новых `users`: 200 против 50
CСравнить `retention rate` на своей базе: 40 из 200 против 15 из 50
DСравнить разницу вернувшихся `users`: 40 минус 15
Ответ: Чтобы сравнить `retention`, нужен сопоставимый `denominator`, поэтому сравнивают `retention rate`, а не абсолютные числа.

Абсолютное число вернувшихся зависит от размера исходной базы и легко вводит в заблуждение. `Retention rate` нормирует результат на `denominator` когорты и позволяет сравнивать эффективность кампаний. После этого отдельно можно обсудить масштаб, если важны и эффективность, и объём.

1234

Хотите тренировать интерактивно?

В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.

Тренировать в Telegram

Другие темы: Логика

Булева логика и фильтрыКачество данных и инвариантыВоронки и когортные рассужденияJOIN и кардинальностьПостановка задачиSanity-check и оценкаСегментация и конфаундингТеория множеств и дедупликацияВзвешенные средние и смешение