Вы видите 300 млн events в день. Коллега заявил, что DAU равен 250 млн. Вы знаете, что у активного пользователя минимум 5 events в день. Какой upper bound sanity-check корректен?
AСравнить 300 млн и 250 млн напрямую: раз они близки, значит всё нормально.
BПостроить
upper bound: DAU не может превышать 300 млн / 5 = 60 млн, значит 250 млн противоречит constraints.CПостроить
lower bound: DAU точно больше 300 млн / 5 = 60 млн, значит 250 млн занижен.DИгнорировать минимум 5
events, потому что он не влияет на units.Правильный ответ. Если известен минимум событий на пользователя, можно поставить
upper bound на DAU через общее число events.Разбор
При constraints минимум 5 events на активного пользователя общее число events ограничивает максимум пользователей. Поэтому DAU не может быть выше 60 млн при 300 млн events. Такой грубая прикидка чек быстро находит ошибки в расчёте уникальных пользователей или в фильтрах активности. Далее стоит проверить дедупликацию пользователей и определение активного дня.
Проверь себя · 1/3разбор после ответа
На лендинг приходит 500 тыс
visits в день. conversion в покупку составляет около 4% (доля визитов с покупкой). Какая грубая прикидка оценка числа покупок в день по units наиболее корректна?Ещё вопросы по теме «Sanity-check и оценка»
- В дашборде метрика `conversion` определена как доля пользователей, совершивших хотя бы одну покупку за день. В отчёте вы видите 130%. Какой грубая прикидка `sanity-check` по `constraints` наиболее уместен?
- У вас 2.5 млн `events` в день и нужно прикинуть объём `events` в месяц для планирования. Какой грубая прикидка перевод `units` самый разумный?
- Каждое событие занимает примерно 1 `KB` в логах, а в день приходит 50 млн `events`. Какой `order of magnitude` для суточного объёма данных ближе всего, если сделать грубая прикидка оценку по `units`?
- У продукта 200 тыс `DAU`. Доля платящих пользователей около 2%, а средний платёж в день на платящего — 500 ₽. Какая грубая прикидка оценка дневной выручки по `units` наиболее адекватна по `order of magnitude`?
- ETL job обработал 120 млн строк за 2 часа. Какой грубая прикидка `throughput` в `rows per second` ближе всего?
- Все вопросы по «Sanity-check и оценка» →