Нужно сделать backfill 2 млрд строк в хранилище. Пайплайн стабильно обрабатывает 50 тыс строк в секунду. Какая грубая прикидка оценка времени ближе всего?
AОколо 11 часов
BОколо 11 дней
CОколо 30 минут
DОколо 3 месяцев
Правильный ответ. Оценка времени через
units rows и throughput помогает быстро проверить план работ.Разбор
2 млрд / 50 тыс ≈ 40 тыс секунд, это около 11 часов по грубая прикидка. Такой order of magnitude чек помогает не перепутать секунды, часы и дни в планировании. Если оценка выходит на месяцы, скорее всего вы забыли про параллелизм или ошиблись в units. После грубой оценки можно добавить upper bound на непредвиденные простои.
Проверь себя · 1/3разбор после ответа
Продукт может отправить не более 3 пушей в день на одного пользователя по
constraints. MAU = 10 млн. Какой upper bound на количество пушей в день вы можете поставить без дополнительных данных?Ещё вопросы по теме «Sanity-check и оценка»
- В дашборде метрика `conversion` определена как доля пользователей, совершивших хотя бы одну покупку за день. В отчёте вы видите 130%. Какой грубая прикидка `sanity-check` по `constraints` наиболее уместен?
- У вас 2.5 млн `events` в день и нужно прикинуть объём `events` в месяц для планирования. Какой грубая прикидка перевод `units` самый разумный?
- Каждое событие занимает примерно 1 `KB` в логах, а в день приходит 50 млн `events`. Какой `order of magnitude` для суточного объёма данных ближе всего, если сделать грубая прикидка оценку по `units`?
- У продукта 200 тыс `DAU`. Доля платящих пользователей около 2%, а средний платёж в день на платящего — 500 ₽. Какая грубая прикидка оценка дневной выручки по `units` наиболее адекватна по `order of magnitude`?
- ETL job обработал 120 млн строк за 2 часа. Какой грубая прикидка `throughput` в `rows per second` ближе всего?
- Все вопросы по «Sanity-check и оценка» →