Нужно сделать дозагрузку 2 млрд строк в хранилище. Пайплайн стабильно обрабатывает 50 тыс строк в секунду. Какая грубая оценка времени ближе всего?
AОколо 11 дней
BОколо 30 минут
CОколо 11 часов
DОколо 3 месяцев
Правильный ответ. Грубая оценка времени через единицы измерения помогает быстро проверить план работ по объёму данных и пропускной способности.
Разбор
2 млрд / 50 тыс ≈ 40 тыс секунд, это около 11 часов в первой грубой прикидке. Такой порядок величин помогает не перепутать секунды, часы и дни в планировании. Если оценка выходит на месяцы, скорее всего, вы забыли про параллелизм или ошиблись в единицах измерения. После грубой оценки можно добавить запас сверху на непредвиденные простои.
Проверь себя · 1/3разбор после ответа
ETL-задача обработала 120 млн строк за 2 часа. Какая грубая прикидка пропускной способности в строках в секунду ближе всего?
Ещё вопросы по теме «Sanity-check и оценка»
- В дашборде метрика конверсии определена как доля пользователей, совершивших хотя бы одну покупку за день. В отчёте вы видите 130%. Какая грубая прикидка по ограничениям метрики наиболее уместна?
- У вас 2.5 млн событий в день и нужно прикинуть объём событий в месяц для планирования. Какой подход к грубой оценке наиболее разумный?
- Каждое событие занимает примерно 1 КБ в логах, а в день приходит 50 млн событий. Какой порядок величины суточного объёма данных ближе всего при грубой прикидке по единицам измерения?
- У продукта 200 тыс DAU. Доля платящих пользователей около 2%, а средний платёж в день на платящего — 500 ₽. Какая грубая оценка дневной выручки наиболее адекватна по порядку величины?
- ETL-задача обработала 120 млн строк за 2 часа. Какая грубая прикидка пропускной способности в строках в секунду ближе всего?
- Все вопросы по «Sanity-check и оценка» →