Известно, что в продукте 5 млн sessions в день, но нет данных, сколько events в среднем приходится на одну session. Какой подход к грубая прикидка оценке числа events в день наиболее адекватен?
AЖдать точные данные и не делать оценок, иначе любой ответ бесполезен.
BВзять ровно 1
event на session, потому что так проще, и считать это точным ответом.CПостроить
bounds: задать разумный lower bound и upper bound для events per session и получить диапазон для events per day.DУмножить 5 млн
sessions на MAU, потому что оба показателя про активность.Правильный ответ. Когда данных нет, полезно строить диапазон через
lower bound и upper bound, а не одну точку.Разбор
В грубая прикидка оценке можно взять минимально возможное число событий на session как lower bound и реалистичный максимум как upper bound. Тогда вы получите диапазон, который легко сравнить с constraints системы и прошлым опытом. Такой подход лучше, чем придумывать одно точное число без оснований. Если позже появятся данные, вы сузите bounds.
Проверь себя · 1/3разбор после ответа
Каждое событие занимает примерно 1
KB в логах, а в день приходит 50 млн events. Какой order of magnitude для суточного объёма данных ближе всего, если сделать грубая прикидка оценку по units?Ещё вопросы по теме «Sanity-check и оценка»
- В дашборде метрика `conversion` определена как доля пользователей, совершивших хотя бы одну покупку за день. В отчёте вы видите 130%. Какой грубая прикидка `sanity-check` по `constraints` наиболее уместен?
- У вас 2.5 млн `events` в день и нужно прикинуть объём `events` в месяц для планирования. Какой грубая прикидка перевод `units` самый разумный?
- Каждое событие занимает примерно 1 `KB` в логах, а в день приходит 50 млн `events`. Какой `order of magnitude` для суточного объёма данных ближе всего, если сделать грубая прикидка оценку по `units`?
- У продукта 200 тыс `DAU`. Доля платящих пользователей около 2%, а средний платёж в день на платящего — 500 ₽. Какая грубая прикидка оценка дневной выручки по `units` наиболее адекватна по `order of magnitude`?
- ETL job обработал 120 млн строк за 2 часа. Какой грубая прикидка `throughput` в `rows per second` ближе всего?
- Все вопросы по «Sanity-check и оценка» →