Известно, что в продукте 5 миллионов сессий в день, но нет данных, сколько событий в среднем приходится на одну сессию. Какой подход к грубой оценке числа событий в день наиболее адекватен?

Question

Карьерник · Accepted Answer

Правильный ответ: Построить границы: задать разумную нижнюю и верхнюю оценку числа событий на сессию и получить диапазон оценки числа событий в день. Когда данных нет, полезно строить диапазон через нижнюю и верхнюю границы, а не одну точку. В грубой оценке можно взять минимально возможное число событий на сессию как нижнюю границу и реалистичный максимум как верхнюю границу. Тогда вы получите диапазон, который легко сравнить с ограничениями системы и прошлым опытом. Подход «один к одному» произвольно занижает оценку, а умножение сессий на `MAU` бессмысленно: единицы не складываются. Если позже появятся данные, диапазон сузится — это и есть рабочая модель оценки на ходу.

Разбор

Ещё вопросы по теме «Sanity-check и оценка»