Question 1

Продукт работает только в стране с населением около 10 млн. В отчёте маркетинга указано 30 млн `MAU`. Какой вывод о границах значения наиболее корректен?

Accepted Answer

Проверка ограничений начинается с очевидных верхних границ — например, размера популяции страны, в которой работает продукт. Если продукт ограничен одной страной, то `MAU` не должен превышать число потенциальных пользователей в этой стране. Значение выше верхней границы обычно означает ошибку в единицах измерения (например, устройства вместо людей), дубли между платформами или неверный метод подсчёта уникальности. Такая грубая прикидка по порядку величины помогает быстро поставить отчёт под сомнение до обсуждения причин роста. Затем нужно уточнить определение активного пользователя и ключ дедупликации.

Question 2

Продукт может отправить не более 3 пушей в день на одного пользователя по правилам. `MAU` = 10 млн. Какой верхний предел на количество пушей в день вы можете поставить без дополнительных данных?

Accepted Answer

Верхний предел строят из явных ограничений: максимум на пользователя умножить на максимум пользователей. Если неизвестен `DAU`, вы всё равно знаете, что `DAU ≤ MAU`, значит максимум пушей в день ограничен 3 × 10 млн = 30 млн. Это грубый верхний предел, но он сразу отсеивает фантастические значения при заданных правилах. Дальше можно уточнять ожидание через предположения о соотношении `DAU/MAU` и фактической частоте отправок на одного пользователя.

Question 3

У продукта 200 тыс DAU. Доля платящих пользователей около 2%, а средний платёж в день на платящего — 500 ₽. Какая грубая оценка дневной выручки наиболее адекватна по порядку величины?

Accepted Answer

Оценка «на коленке»: пользователи × доля платящих × средний платёж — даёт правильный порядок величины выручки. Сначала оцените число платящих: 200 тыс DAU × 2% ≈ 4 тыс платящих в день. Затем умножьте на 500 ₽ и получите около 2 млн ₽ в день. Такой расчёт полезен как быстрая проверка: он сразу показывает, на сколько нулей отличается итог от ожидаемого. Если бы при таких входных получились сотни миллионов, это явный сбой по порядку величины и сигнал искать ошибку в формуле или в единицах.

Question 4

Нужно сделать дозагрузку 2 млрд строк в хранилище. Пайплайн стабильно обрабатывает 50 тыс строк в секунду. Какая грубая оценка времени ближе всего?

Accepted Answer

Грубая оценка времени через единицы измерения помогает быстро проверить план работ по объёму данных и пропускной способности. 2 млрд / 50 тыс ≈ 40 тыс секунд, это около 11 часов в первой грубой прикидке. Такой порядок величин помогает не перепутать секунды, часы и дни в планировании. Если оценка выходит на месяцы, скорее всего, вы забыли про параллелизм или ошиблись в единицах измерения. После грубой оценки можно добавить запас сверху на непредвиденные простои.

Question 5

В каталоге всего 10 тыс товаров. В отчёте за день показатель уникальных проданных позиций равен 12 тыс. Что говорит проверка ограничений на адекватность?

Accepted Answer

Если результат превышает очевидную верхнюю границу, сначала ищите ошибку в расчёте, а не объяснение в данных по бизнесу. При фиксированном каталоге максимум уникальных позиций за день ограничен размером каталога. Значение выше этой верхней границы обычно появляется из-за неверного уровня уникальности (например, считаете `sku_id` вместе с `store_id`) или из-за дублей после джойна. Грубая проверка ограничений помогает быстро локализовать такие баги. После исправления стоит сверить ключи агрегации и логику дедупликации.

Sanity-check и оценка: вопросы для собеседования (часть 2)

Вопросы 6–10 из 20

Хотите тренировать интерактивно?

Другие темы: Логика