Система пишет 1 TB логов в день. По предположениям, размер одного события — от 200 до 500 байт. Какой диапазон количества событий в день наиболее разумен по порядку величины?
AОт 2 до 5 миллионов событий в день, если исходить из заданного объёма логов и среднего размера одного события
BОт 20 до 50 миллионов событий в день при заданных границах размера события и суммарном объёме логов в сутки
CОт 2 до 5 миллиардов событий в день, исходя из заданного диапазона размеров события и общего объёма логов
DОт 200 до 500 миллиардов событий в день при указанных предположениях о размере события и объёме данных
Правильный ответ. Используйте нижнюю и верхнюю границы размера одного объекта, чтобы получить границы для общего количества объектов.
Разбор
Если логов 1 TB в день, то при 500 байтах на событие получится около 2 миллиардов событий, а при 200 байтах — около 5 миллиардов. Это грубая прикидка, но она даёт правильный порядок величины. Такой диапазон помогает проверить, не ошиблись ли вы в единицах измерения или в оценке размера события. Затем можно уточнять средний размер и сжатие.
Проверь себя · 1/3разбор после ответа
Каждое событие занимает примерно 1 КБ в логах, а в день приходит 50 млн событий. Какой порядок величины суточного объёма данных ближе всего при грубой прикидке по единицам измерения?
Ещё вопросы по теме «Sanity-check и оценка»
- В дашборде метрика конверсии определена как доля пользователей, совершивших хотя бы одну покупку за день. В отчёте вы видите 130%. Какая грубая прикидка по ограничениям метрики наиболее уместна?
- У вас 2.5 млн событий в день и нужно прикинуть объём событий в месяц для планирования. Какой подход к грубой оценке наиболее разумный?
- Каждое событие занимает примерно 1 КБ в логах, а в день приходит 50 млн событий. Какой порядок величины суточного объёма данных ближе всего при грубой прикидке по единицам измерения?
- У продукта 200 тыс DAU. Доля платящих пользователей около 2%, а средний платёж в день на платящего — 500 ₽. Какая грубая оценка дневной выручки наиболее адекватна по порядку величины?
- ETL-задача обработала 120 млн строк за 2 часа. Какая грубая прикидка пропускной способности в строках в секунду ближе всего?
- Все вопросы по «Sanity-check и оценка» →