Известно, что в продукте 5 миллионов сессий в день, но нет данных, сколько событий в среднем приходится на одну сессию. Какой подход к грубой оценке числа событий в день наиболее адекватен?
AВзять одно событие на сессию по умолчанию и зафиксировать это число как точную оценку, не уточняя реальное распределение событий
BПостроить границы: задать разумную нижнюю и верхнюю оценку числа событий на сессию и получить диапазон оценки числа событий в день
CВзять медианное число событий на сессию по соседнему продукту с похожим профилем и применить его к нашим 5 миллионам сессий
DИспользовать число событий на пользователя из публичных бенчмарков и умножить его на месячную аудиторию для пересчёта в день
Правильный ответ. Когда данных нет, полезно строить диапазон через нижнюю и верхнюю границы, а не одну точку.
Разбор
В грубой оценке можно взять минимально возможное число событий на сессию как нижнюю границу и реалистичный максимум как верхнюю границу. Тогда вы получите диапазон, который легко сравнить с ограничениями системы и прошлым опытом. Подход «один к одному» произвольно занижает оценку, а умножение сессий на MAU бессмысленно: единицы не складываются. Если позже появятся данные, диапазон сузится — это и есть рабочая модель оценки на ходу.
Проверь себя · 1/3разбор после ответа
На лендинг приходит 500 тыс визитов в день. Конверсия в покупку составляет около 4% (доля визитов с покупкой). Какая грубая прикидка числа покупок в день при сохранении единиц измерения наиболее корректна?
Ещё вопросы по теме «Sanity-check и оценка»
- В дашборде метрика конверсии определена как доля пользователей, совершивших хотя бы одну покупку за день. В отчёте вы видите 130%. Какая грубая прикидка по ограничениям метрики наиболее уместна?
- У вас 2.5 млн событий в день и нужно прикинуть объём событий в месяц для планирования. Какой подход к грубой оценке наиболее разумный?
- Каждое событие занимает примерно 1 КБ в логах, а в день приходит 50 млн событий. Какой порядок величины суточного объёма данных ближе всего при грубой прикидке по единицам измерения?
- У продукта 200 тыс DAU. Доля платящих пользователей около 2%, а средний платёж в день на платящего — 500 ₽. Какая грубая оценка дневной выручки наиболее адекватна по порядку величины?
- ETL-задача обработала 120 млн строк за 2 часа. Какая грубая прикидка пропускной способности в строках в секунду ближе всего?
- Все вопросы по «Sanity-check и оценка» →