Как строить гипотезы в аналитике

Зачем это важно

Плохая гипотеза → потеря времени на тест, который ничего не даст.

Хорошая гипотеза — конкретная, измеримая, с прогнозом эффекта.

Структура хорошей гипотезы

Классический шаблон:

«Если [действие] для [сегмент пользователей], то [метрика] изменится на [X%], потому что [причина].»

Пример:

«Если упростим onboarding до 3 шагов (сейчас 7) для новых iOS-пользователей, то D1 retention вырастет на 5% p.p., потому что 50% сейчас отваливаются на шаге 4.»

Четыре элемента

1. Action (что именно меняем)

  • ❌ «Улучшим onboarding».
  • ✅ «Сократим onboarding с 7 шагов до 3».

2. Segment (на ком тестируем)

  • ❌ «Все пользователи».
  • ✅ «Новые iOS-пользователи из органического трафика».

3. Metric + Expected Change

  • ❌ «Метрики улучшатся».
  • ✅ «D1 retention вырастет на 5% p.p. с 40% до 45%».

4. Reasoning (почему думаете, что это сработает)

  • ❌ «Потому что это улучшит опыт».
  • ✅ «Потому что данные показывают: 50% пользователей уходят на шаге 4; если убрать его, они не уйдут».

Где брать идеи

1. Воронка — найти drop-off

Построить воронку, найти шаг с большим оттоком. Гипотеза: «упростим этот шаг».

2. Сегменты

Сравнить разные сегменты. «iOS retention выше Android на 15 п.п. Что на iOS особенного? Повторим на Android».

3. Конкуренты

Смотрите, что работает в других продуктах. Гипотеза: «это может работать и у нас».

4. Качественные данные

Интервью, surveys, отзывы. Гипотеза: «если решим проблему X (много жалоб) — ...».

5. Экспериментальные находки

Прошлый A/B дал инсайт → новая гипотеза для развития.

Попробовать силы на подобных вопросах проще всего в тренажёре Карьерник — прямо в Telegram, без регистрации через сайт.

ICE — приоритизация гипотез

ICE = Impact × Confidence × Ease

Каждый фактор 1–10. Сумма баллов = приоритет.

Impact (ожидаемое влияние)

  • Насколько значимо улучшит метрику?
  • Сколько пользователей затронет?

Confidence (уверенность)

  • Есть ли данные в пользу гипотезы?
  • Работало ли подобное у других?

Ease (лёгкость реализации)

  • Сколько времени разработка?
  • Нужны ли сложные изменения?

Пример

Гипотеза Impact Confidence Ease Score
Упростить onboarding 8 7 5 280
Новый pricing 9 4 3 108
Push за неделю 5 8 9 360

→ Начинаем с push notifications — самый высокий ICE.

RICE — расширенная версия

RICE = (Reach × Impact × Confidence) / Effort

Добавляет Reach — сколько пользователей затронет (в абсолютных числах).

Для scale-up продуктов удобнее.

Антипатерны

1. Too vague

«Улучшим UX» — без action/metric. Не тестируется.

2. No reasoning

«Сделаем кнопку больше». Почему? Данные есть? Если нет — пробовать бессмысленно.

3. Слишком большие ожидания

«+50% retention» — нереально. Типично лифты 1–5%.

4. Несегментированность

«Для всех» — может быть effect heterogeneity.

5. Non-measurable

«Улучшим лояльность» — как мерить? Нужна прокси-метрика (retention, NPS, повторные покупки).

Pre-mortem перед тестом

Перед запуском A/B задайте 5 вопросов:

  1. Что будет, если тест покажет negative эффект? Откатим? Если да — OK.
  2. Что если не значимо? Есть MDE? Какая мощность?
  3. Какие guardrails проверим?
  4. Какой post-hoc анализ сделаем?
  5. Сегменты — где ждать разный эффект?

Пройти 30–50 задач по теме за вечер можно в Telegram-тренажёре. Это то, что отличает «знаю» от «уверенно отвечу на собесе».

Пример полного оформления

Название: Reduce signup form from 8 to 4 fields.

Сегмент: New users, all platforms.

Action: Убрать поля: company, phone, job_title, referral.

Target metric: Conversion signup form submit → signup complete.

Baseline: 35%.

Expected: 45% (+10 п.п.).

Reasoning: По данным analytics, 60% dropoff — после field #5 (job_title). Убрав его и 3 других, ожидаем резкий рост completion.

Guardrails: Качество лидов (paying conversion от новых signups не должна упасть >5%).

Duration: 2 недели.

Sample size: 10k на группу (для MDE=5%).

Risks: Если paying conversion упадёт > 5% — тест отменяем. Если guardrail OK и main metric significant — катим.

Тестирование против анализа

Гипотеза для эксперимента

Чёткая, узкая, с конкретным effect.

Гипотеза для анализа

Может быть шире: «У нас есть подозрение, что платящие пользователи больше используют feature X».

Обе важны — разные инструменты (A/B vs data analysis).

Читайте также

FAQ

ICE или RICE?

Для early-stage продукта — ICE (меньше данных). Для scale — RICE (важен охват).

Сколько гипотез держать в backlog?

20–50. Больше — хаос. Меньше — нет из чего выбирать.

Кто должен формулировать гипотезы?

Совместно: PM (бизнес-цели), аналитик (данные), designer/dev (feasibility).

Как понять, что гипотеза плохая?

Если не можете ответить «почему это сработает» через данные — гипотеза слабая.