Вы видите 300 млн событий в день. Коллега заявил, что DAU равен 250 млн. Вы знаете, что у активного пользователя минимум 5 событий в день. Какая прикидка верхней границы корректна?
AСравнить 300 млн событий и 250 млн
DAU напрямую: раз цифры одного порядка, значит данные согласованы и проверять нечегоBПостроить нижнюю границу:
DAU точно больше 300 млн / 5 = 60 млн, поэтому 250 млн выглядит заниженным относительно событийCПостроить верхнюю границу:
DAU не может превышать 300 млн / 5 = 60 млн, значит 250 млн противоречит ограничению на минимум событийDИгнорировать минимум 5 событий на пользователя, потому что это правило про активность не влияет на оценку числа уникальных людей
Правильный ответ. Если известен минимум событий на пользователя, можно поставить верхнюю границу
DAU через общее число событий.Разбор
Если у каждого активного пользователя минимум 5 событий, то общее число событий ограничивает максимум пользователей: DAU не может быть выше 300 млн / 5 = 60 млн. Поэтому заявленные 250 млн противоречат этому ограничению, и расчёт нужно перепроверить — скорее всего, проблема в дедупликации пользователей или в определении активного дня. Прямое сравнение цифр без модели не ловит эту ошибку, нижняя граница построена с обратным знаком неравенства, а игнорирование правила активности убирает сам инструмент проверки.
Проверь себя · 1/3разбор после ответа
У вас MAU = 3 млн. Из исследований известно, что средний пользователь активен около 5 дней в месяц. Какая грубая прикидка DAU ближе всего?
Ещё вопросы по теме «Sanity-check и оценка»
- В дашборде метрика конверсии определена как доля пользователей, совершивших хотя бы одну покупку за день. В отчёте вы видите 130%. Какая грубая прикидка по ограничениям метрики наиболее уместна?
- У вас 2.5 млн событий в день и нужно прикинуть объём событий в месяц для планирования. Какой подход к грубой оценке наиболее разумный?
- Каждое событие занимает примерно 1 КБ в логах, а в день приходит 50 млн событий. Какой порядок величины суточного объёма данных ближе всего при грубой прикидке по единицам измерения?
- У продукта 200 тыс DAU. Доля платящих пользователей около 2%, а средний платёж в день на платящего — 500 ₽. Какая грубая оценка дневной выручки наиболее адекватна по порядку величины?
- ETL-задача обработала 120 млн строк за 2 часа. Какая грубая прикидка пропускной способности в строках в секунду ближе всего?
- Все вопросы по «Sanity-check и оценка» →