Вопросы по теме «Постановка задачи»

Как превратить бизнес-вопрос в аналитическую задачу: определить метрику, выбрать гранулярность, учесть ограничения данных. На собеседовании дают кейс вроде «продажи упали» и ждут, что кандидат задаст правильные уточняющие вопросы, прежде чем бросаться писать запрос. Фреймирование задачи — первый шаг любого анализа.

Всего в этом разделе 20 вопросов. Каждый — с правильным ответом и кратким разбором теории. Разбито на 4 части по 5 вопросов.

Булева логика и фильтрыКачество данных и инвариантыВоронки и когортные рассужденияJOIN и кардинальностьДоли и процентыSanity-check и оценкаСегментация и конфаундингТеория множеств и дедупликацияВзвешенные средние и смешение

Вопросы 15 из 20

1PM говорит: Нужно поднять `retention` в следующем квартале. Какой вопрос лучше задать первым, чтобы отделить `goal` от `metric` и зафиксировать `criteria` успеха?
AКакие фичи вы уже хотите сделать, чтобы я сразу посчитал прогноз эффекта
BКакой именно `retention` нужен: `definition` возврата, `time window`, целевая `population` и `criteria` успеха по сравнению с `baseline`
CДавайте просто возьмем `DAU` как прокси и будем оптимизировать его
DНужно ли сразу собирать отзывы пользователей, чтобы понять причины
Ответ: Сначала нужно согласовать `goal`, затем выбрать `metric` с явными `definition`, `time window` и `criteria` успеха.

Один и тот же `goal` можно измерять разными `metric`: `D1 retention`, `D7 retention`, `weekly retention` и так далее. Без явной `definition` возврата вы можете построить красивый отчет, который не отвечает на вопрос бизнеса. Зафиксируйте `population`, `time window` и целевое изменение относительно `baseline`, чтобы далее обсуждать решения предметно.

2Руководитель просит: Сколько у нас `active users` за прошлый месяц. Какой первый шаг наиболее правильный, чтобы избежать спорных `edge cases`?
AВзять всех, кто хоть раз открыл приложение, и назвать это `active users`
BПосчитать уникальные `user_id`, у которых был любой `event`, и сразу отправить число
CПосчитать `MAU` и сказать, что это и есть `active users`
DУточнить `definition` активности (какой `event` и порог), границы `time window` и `population` (платформы, регионы), плюс правила для `edge cases` вроде тестовых аккаунтов
Ответ: Термин активный пользователь требует `definition`, `population` и обработки `edge cases`, иначе `metric` будет неповторяемой.

Активность может означать просто запуск приложения, выполнение ключевого действия или достижение порога действий. Без явной `definition` разные команды будут считать разные числа. Важно также определить `population` и `time window`, включая часовой пояс, а затем зафиксировать правила для `edge cases` вроде дублей, тестовых аккаунтов и аномальной активности.

3CEO пишет: `DAU` упал на прошлой неделе, разберись что случилось. Что важнее всего уточнить в первую очередь, чтобы зафиксировать корректный `scope` и не уйти в ложные причины?
AУточнить `definition` `DAU`, `population` и `time window`, а также проверить, не было ли изменений в `tracking` или источниках данных
BСразу построить топ-10 причин падения по всем возможным `segment` и отправить отчет
CСразу предложить план роста `DAU` и запустить несколько инициатив параллельно
DСразу сравнить прошлую неделю с позапрошлой и сделать вывод, что причина в сезоне
Ответ: Без четких `definition` и `scope` падение `metric` может быть артефактом данных, а не продуктовым эффектом.

Фраза `DAU` упал не определяет, что именно считается активностью и кого вы считаете в `population`. Без `time window` и проверки `tracking` легко перепутать реальное изменение поведения с багом в событиях или фильтрах. Первым шагом нужно согласовать `definition` и убедиться, что измерение стабильно, и только потом искать причины в продукте.

4Вам говорят: Сделай дашборд по `NPS`. Какое уточнение самое важное для корректной `population` и `time window`?
AКакую цветовую палитру и шрифты использовать в дашборде
BКого именно опрашиваем и кого включаем в `population`, за какой `time window` считаем `NPS`, и как обрабатываем неполные ответы как `edge cases`
CХотим ли добавить разбивку по типу устройства пользователя
DНужно ли выводить `NPS` отдельно по каждому месяцу
Ответ: Для `NPS` важно зафиксировать `population`, `time window` и правила учета ответов, иначе сравнения будут некорректны.

Если `NPS` собирается только у части пользователей, важно понимать, кто попадает в выборку и насколько она репрезентативна для `population`. Также нужно определить `time window`, например по дате ответа или по дате события, после которого отправили опрос. Наконец, правила обработки `edge cases` вроде пропусков или повторных ответов влияют на итоговую метрику и должны быть едиными.

5PM спрашивает: Сколько пользователей используют фичу X. Какое уточнение наиболее важное, чтобы корректно определить `population` и `time window`?
AНужно ли разбить данные по платформам (iOS/Android/Web) и показать динамику использования фичи X отдельно для каждой из них в разрезе последних 30 дней.
BНужно ли дополнить количественные данные качественными: включить в отчёт отзывы и комментарии пользователей, чтобы понять, почему они используют или не используют фичу X.
CЧто именно считается использованием по `definition` (какой `event`), нужен ли порог частоты, какая `population` и за какой `time window` считаем уникальных пользователей
DНужно ли добавить тепловую карту экранов и показать, в каких частях интерфейса фича X встречается чаще всего, чтобы оценить её видимость и доступность для пользователей.
Ответ: Для метрики использования нужно определить `definition` события и `time window` для одной `population`, иначе цифры будут несопоставимы.

Использование может означать клик, успешное завершение действия или повторное использование, и это разные `definition`. Также важен порог: один раз за месяц и десять раз за неделю отвечают на разные вопросы. Наконец, `population` и `time window` определяют, кого и когда вы считаете, а это влияет на интерпретацию изменения метрики. После согласования можно добавлять разрезы по платформам и экранам.

1234

Хотите тренировать интерактивно?

В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.

Тренировать в Telegram

Другие темы: Логика

Булева логика и фильтрыКачество данных и инвариантыВоронки и когортные рассужденияJOIN и кардинальностьДоли и процентыSanity-check и оценкаСегментация и конфаундингТеория множеств и дедупликацияВзвешенные средние и смешение