Cross-sectional vs longitudinal
Карьерник — квиз-тренажёр в Telegram с 1500+ вопросами для собесов аналитика. SQL, Python, A/B, метрики. Бесплатно.
Короткий ответ
- Cross-sectional — снимок данных в один момент времени (фото)
- Longitudinal — данные одних объектов во времени (видео)
Cross-sectional дёшево и быстро, но ограничено. Longitudinal дороже, но показывает изменения и причинность.
Примеры
Cross-sectional
- Снимок на конец месяца: все активные подписчики
- Опрос 1000 случайных пользователей сегодня
- Таблица users на сейчас
- A/B-тест одной недели
Longitudinal
- Retention по месяцам с момента регистрации
- Данные по одним пользователям в течение года
- Time series MRR за 5 лет
- Cohort analysis
Сравнение
| Cross-sectional | Longitudinal | |
|---|---|---|
| Время | один момент | много моментов |
| Объекты | одни разные в разное время | одни и те же |
| Стоимость | низкая | высокая |
| Данные | быстро получить | долго собирать |
| Causality | слабо | сильнее |
| Тренды | не видны | видны |
| Cohort | не работает | работает |
В SQL
Cross-sectional
-- данные на один момент
SELECT * FROM users WHERE status = 'active' AND DATE = '2026-04-22';Longitudinal (panel data)
-- одни и те же пользователи в разные моменты
SELECT user_id, month, activity
FROM user_monthly_stats
WHERE user_id IN (1, 2, 3)
ORDER BY user_id, month;Применение в аналитике
Cross-sectional
- Snapshot reporting: MAU на сегодня
- Survey: опрос текущих пользователей
- Segmentation: сейчас кто в каком сегменте
- A/B snapshot: результат на момент окончания теста
Longitudinal
- Retention / cohort analysis
- Time series forecasting
- Customer lifetime analysis
- Churn prediction (история поведения)
- LTV расчёт
- Причинность в observational studies
Panel data
Panel data — это longitudinal в структурированном виде.
user_id | month | revenue
1 | 2026-01 | 100
1 | 2026-02 | 150
1 | 2026-03 | 120
2 | 2026-01 | 200
2 | 2026-02 | 250
...Каждая строка — (объект, время). Анализ по обеим осям.
Методы:
- Fixed effects regression
- Random effects
- Difference-in-differences
Проблемы cross-sectional
1. Не видны изменения
Снимок не показывает тренды.
2. Correlation ≠ causation
Сильная correlation в cross-sectional часто обманчива.
Пример: «у людей с высоким доходом больше сбережений». Почему? Из cross-sectional не ясно (богатые копят vs копящие богатеют).
3. Selection bias
Нет контроля за тем, кто попал в snapshot.
Проблемы longitudinal
1. Attrition
Часть объектов уходит. Оставшиеся не репрезентативны.
2. Стоимость
Долго собирать. Для 5 лет — 5 лет ждать.
3. Privacy
Tracking пользователей во времени — приватные риски.
4. Технически сложнее
Обработка panel data ≠ просто SELECT.
Идеальное сочетание
В продукте обычно:
- Cross-sectional для быстрых ответов («сколько сейчас?»)
- Longitudinal для глубокого анализа («как меняется?»)
На собесе
«Разница cross-sectional и longitudinal?» Cross-sectional — один момент. Longitudinal — одни объекты во времени.
«Пример каждого?» Cross: MAU на сегодня. Longitudinal: retention curve когорты.
«Когда cross-sectional недостаточно?» Когда нужны тренды, изменения, причинно-следственные связи.
«Problem longitudinal?» Attrition, privacy, стоимость.
Частые ошибки
1. Делать выводы о changes из cross-sectional
«В 2026 у нас revenue 10M. Пять лет назад было 2M → рост 5×». Без longitudinal — просто snapshots.
2. Survivorship в longitudinal
Analysis только по остающимся в выборке. Ушедшие не учтены.
3. Cross-sectional без snapshot timing
«Выборка с февраля до апреля» — это уже не pure cross-sectional.
4. Смешивать cross-sectional и panel в анализе
Разные методы. Нельзя просто GROUP BY.
Longitudinal в продукте
Tracking поведения
События с user_id + timestamp → panel data.
Retention table
Когорта × период — longitudinal analysis.
Churn prediction
Фичи: активность за последние 7, 30, 90 дней (longitudinal).
LTV
Платежи одного пользователя во времени.
Связанные темы
- Когортный анализ простыми словами
- Что такое когорта простыми словами
- Retention простыми словами
- Sample vs population
FAQ
Панельные данные = longitudinal?
В основном да. Panel = longitudinal со structured формой (объекты × время).
Cohort — это longitudinal?
Да. Одни и те же пользователи наблюдаются во времени.
Cross-sectional можно использовать для A/B?
Да, но только для снимка результата. Для изучения как reaction меняется во времени — longitudinal.
Survey в году — cross-sectional?
Если разный опрос каждый год (разные респонденты) — repeated cross-sectional. Если одни люди — longitudinal panel.
Тренируйте аналитику — откройте тренажёр с 1500+ вопросами для собесов.