ETL job обработал 120 млн строк за 2 часа. Какой грубая прикидка throughput в rows per second ближе всего?
AОколо 17 тыс строк в секунду
BОколо 170 строк в секунду
CОколо 170 тыс строк в секунду
DОколо 1.7 млн строк в секунду
Правильный ответ. Перевод времени в секунды и расчёт
throughput помогают быстро проверить реалистичность скорости обработки.Разбор
2 часа — это 7200 секунд, поэтому 120 млн / 7200 ≈ 17 тыс строк в секунду по грубая прикидка. Такой units чек помогает поймать ошибки вроде перепутанных минут и секунд. Если получилось 1.7 млн строк в секунду, стоит пересчитать, не потеряли ли вы ноль или не перепутали rows и batches. В интервью важно уметь сделать такую оценку без точного калькулятора.
Проверь себя · 1/3разбор после ответа
На лендинг приходит 500 тыс
visits в день. conversion в покупку составляет около 4% (доля визитов с покупкой). Какая грубая прикидка оценка числа покупок в день по units наиболее корректна?Ещё вопросы по теме «Sanity-check и оценка»
- В дашборде метрика `conversion` определена как доля пользователей, совершивших хотя бы одну покупку за день. В отчёте вы видите 130%. Какой грубая прикидка `sanity-check` по `constraints` наиболее уместен?
- У вас 2.5 млн `events` в день и нужно прикинуть объём `events` в месяц для планирования. Какой грубая прикидка перевод `units` самый разумный?
- Каждое событие занимает примерно 1 `KB` в логах, а в день приходит 50 млн `events`. Какой `order of magnitude` для суточного объёма данных ближе всего, если сделать грубая прикидка оценку по `units`?
- У продукта 200 тыс `DAU`. Доля платящих пользователей около 2%, а средний платёж в день на платящего — 500 ₽. Какая грубая прикидка оценка дневной выручки по `units` наиболее адекватна по `order of magnitude`?
- Продукт может отправить не более 3 пушей в день на одного пользователя по `constraints`. `MAU` = 10 млн. Какой `upper bound` на количество пушей в день вы можете поставить без дополнительных данных?
- Все вопросы по «Sanity-check и оценка» →