Известно, что в продукте 5 млн sessions в день, но нет данных, сколько events в среднем приходится на одну session. Какой подход к грубая прикидка оценке числа events в день наиболее адекватен?

AЖдать точные данные и не делать оценок, иначе любой ответ бесполезен.
BВзять ровно 1 event на session, потому что так проще, и считать это точным ответом.
CПостроить bounds: задать разумный lower bound и upper bound для events per session и получить диапазон для events per day.
DУмножить 5 млн sessions на MAU, потому что оба показателя про активность.
Правильный ответ. Когда данных нет, полезно строить диапазон через lower bound и upper bound, а не одну точку.

Разбор

В грубая прикидка оценке можно взять минимально возможное число событий на session как lower bound и реалистичный максимум как upper bound. Тогда вы получите диапазон, который легко сравнить с constraints системы и прошлым опытом. Такой подход лучше, чем придумывать одно точное число без оснований. Если позже появятся данные, вы сузите bounds.

Проверь себя · 1/3разбор после ответа
Каждое событие занимает примерно 1 KB в логах, а в день приходит 50 млн events. Какой order of magnitude для суточного объёма данных ближе всего, если сделать грубая прикидка оценку по units?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Sanity-check и оценка»