Как строить гипотезы в аналитике
Зачем это важно
Плохая гипотеза → потеря времени на тест, который ничего не даст.
Хорошая гипотеза — конкретная, измеримая, с прогнозом эффекта.
Структура хорошей гипотезы
Классический шаблон:
«Если [действие] для [сегмент пользователей], то [метрика] изменится на [X%], потому что [причина].»
Пример:
«Если упростим onboarding до 3 шагов (сейчас 7) для новых iOS-пользователей, то D1 retention вырастет на 5% p.p., потому что 50% сейчас отваливаются на шаге 4.»
Четыре элемента
1. Action (что именно меняем)
- ❌ «Улучшим onboarding».
- ✅ «Сократим onboarding с 7 шагов до 3».
2. Segment (на ком тестируем)
- ❌ «Все пользователи».
- ✅ «Новые iOS-пользователи из органического трафика».
3. Metric + Expected Change
- ❌ «Метрики улучшатся».
- ✅ «D1 retention вырастет на 5% p.p. с 40% до 45%».
4. Reasoning (почему думаете, что это сработает)
- ❌ «Потому что это улучшит опыт».
- ✅ «Потому что данные показывают: 50% пользователей уходят на шаге 4; если убрать его, они не уйдут».
Где брать идеи
1. Воронка — найти drop-off
Построить воронку, найти шаг с большим оттоком. Гипотеза: «упростим этот шаг».
2. Сегменты
Сравнить разные сегменты. «iOS retention выше Android на 15 п.п. Что на iOS особенного? Повторим на Android».
3. Конкуренты
Смотрите, что работает в других продуктах. Гипотеза: «это может работать и у нас».
4. Качественные данные
Интервью, surveys, отзывы. Гипотеза: «если решим проблему X (много жалоб) — ...».
5. Экспериментальные находки
Прошлый A/B дал инсайт → новая гипотеза для развития.
Попробовать силы на подобных вопросах проще всего в тренажёре Карьерник — прямо в Telegram, без регистрации через сайт.
ICE — приоритизация гипотез
ICE = Impact × Confidence × Ease
Каждый фактор 1–10. Сумма баллов = приоритет.
Impact (ожидаемое влияние)
- Насколько значимо улучшит метрику?
- Сколько пользователей затронет?
Confidence (уверенность)
- Есть ли данные в пользу гипотезы?
- Работало ли подобное у других?
Ease (лёгкость реализации)
- Сколько времени разработка?
- Нужны ли сложные изменения?
Пример
| Гипотеза | Impact | Confidence | Ease | Score |
|---|---|---|---|---|
| Упростить onboarding | 8 | 7 | 5 | 280 |
| Новый pricing | 9 | 4 | 3 | 108 |
| Push за неделю | 5 | 8 | 9 | 360 |
→ Начинаем с push notifications — самый высокий ICE.
RICE — расширенная версия
RICE = (Reach × Impact × Confidence) / Effort
Добавляет Reach — сколько пользователей затронет (в абсолютных числах).
Для scale-up продуктов удобнее.
Антипатерны
1. Too vague
«Улучшим UX» — без action/metric. Не тестируется.
2. No reasoning
«Сделаем кнопку больше». Почему? Данные есть? Если нет — пробовать бессмысленно.
3. Слишком большие ожидания
«+50% retention» — нереально. Типично лифты 1–5%.
4. Несегментированность
«Для всех» — может быть effect heterogeneity.
5. Non-measurable
«Улучшим лояльность» — как мерить? Нужна прокси-метрика (retention, NPS, повторные покупки).
Pre-mortem перед тестом
Перед запуском A/B задайте 5 вопросов:
- Что будет, если тест покажет negative эффект? Откатим? Если да — OK.
- Что если не значимо? Есть MDE? Какая мощность?
- Какие guardrails проверим?
- Какой post-hoc анализ сделаем?
- Сегменты — где ждать разный эффект?
Пройти 30–50 задач по теме за вечер можно в Telegram-тренажёре. Это то, что отличает «знаю» от «уверенно отвечу на собесе».
Пример полного оформления
Название: Reduce signup form from 8 to 4 fields.
Сегмент: New users, all platforms.
Action: Убрать поля: company, phone, job_title, referral.
Target metric: Conversion signup form submit → signup complete.
Baseline: 35%.
Expected: 45% (+10 п.п.).
Reasoning: По данным analytics, 60% dropoff — после field #5 (job_title). Убрав его и 3 других, ожидаем резкий рост completion.
Guardrails: Качество лидов (paying conversion от новых signups не должна упасть >5%).
Duration: 2 недели.
Sample size: 10k на группу (для MDE=5%).
Risks: Если paying conversion упадёт > 5% — тест отменяем. Если guardrail OK и main metric significant — катим.
Тестирование против анализа
Гипотеза для эксперимента
Чёткая, узкая, с конкретным effect.
Гипотеза для анализа
Может быть шире: «У нас есть подозрение, что платящие пользователи больше используют feature X».
Обе важны — разные инструменты (A/B vs data analysis).
Читайте также
- Проверка гипотез
- Задачи на A/B
- A/B-тестирование гайд
- Что такое A/B-тест
- Кейс: как оценить эффект фичи
FAQ
ICE или RICE?
Для early-stage продукта — ICE (меньше данных). Для scale — RICE (важен охват).
Сколько гипотез держать в backlog?
20–50. Больше — хаос. Меньше — нет из чего выбирать.
Кто должен формулировать гипотезы?
Совместно: PM (бизнес-цели), аналитик (данные), designer/dev (feasibility).
Как понять, что гипотеза плохая?
Если не можете ответить «почему это сработает» через данные — гипотеза слабая.