ETL job обработал 120 млн строк за 2 часа. Какой грубая прикидка throughput в rows per second ближе всего?

AОколо 17 тыс строк в секунду
BОколо 170 строк в секунду
CОколо 170 тыс строк в секунду
DОколо 1.7 млн строк в секунду
Правильный ответ. Перевод времени в секунды и расчёт throughput помогают быстро проверить реалистичность скорости обработки.

Разбор

2 часа — это 7200 секунд, поэтому 120 млн / 7200 ≈ 17 тыс строк в секунду по грубая прикидка. Такой units чек помогает поймать ошибки вроде перепутанных минут и секунд. Если получилось 1.7 млн строк в секунду, стоит пересчитать, не потеряли ли вы ноль или не перепутали rows и batches. В интервью важно уметь сделать такую оценку без точного калькулятора.

Проверь себя · 1/3разбор после ответа
На лендинг приходит 500 тыс visits в день. conversion в покупку составляет около 4% (доля визитов с покупкой). Какая грубая прикидка оценка числа покупок в день по units наиболее корректна?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Sanity-check и оценка»