Cross-sectional vs longitudinal

Карьерник — квиз-тренажёр в Telegram с 1500+ вопросами для собесов аналитика. SQL, Python, A/B, метрики. Бесплатно.

Короткий ответ

  • Cross-sectional — снимок данных в один момент времени (фото)
  • Longitudinal — данные одних объектов во времени (видео)

Cross-sectional дёшево и быстро, но ограничено. Longitudinal дороже, но показывает изменения и причинность.

Примеры

Cross-sectional

  • Снимок на конец месяца: все активные подписчики
  • Опрос 1000 случайных пользователей сегодня
  • Таблица users на сейчас
  • A/B-тест одной недели

Longitudinal

  • Retention по месяцам с момента регистрации
  • Данные по одним пользователям в течение года
  • Time series MRR за 5 лет
  • Cohort analysis

Сравнение

Cross-sectional Longitudinal
Время один момент много моментов
Объекты одни разные в разное время одни и те же
Стоимость низкая высокая
Данные быстро получить долго собирать
Causality слабо сильнее
Тренды не видны видны
Cohort не работает работает

В SQL

Cross-sectional

-- данные на один момент
SELECT * FROM users WHERE status = 'active' AND DATE = '2026-04-22';

Longitudinal (panel data)

-- одни и те же пользователи в разные моменты
SELECT user_id, month, activity
FROM user_monthly_stats
WHERE user_id IN (1, 2, 3)
ORDER BY user_id, month;

Применение в аналитике

Cross-sectional

  • Snapshot reporting: MAU на сегодня
  • Survey: опрос текущих пользователей
  • Segmentation: сейчас кто в каком сегменте
  • A/B snapshot: результат на момент окончания теста

Longitudinal

  • Retention / cohort analysis
  • Time series forecasting
  • Customer lifetime analysis
  • Churn prediction (история поведения)
  • LTV расчёт
  • Причинность в observational studies

Panel data

Panel data — это longitudinal в структурированном виде.

user_id | month    | revenue
1       | 2026-01  | 100
1       | 2026-02  | 150
1       | 2026-03  | 120
2       | 2026-01  | 200
2       | 2026-02  | 250
...

Каждая строка — (объект, время). Анализ по обеим осям.

Методы:

  • Fixed effects regression
  • Random effects
  • Difference-in-differences

Проблемы cross-sectional

1. Не видны изменения

Снимок не показывает тренды.

2. Correlation ≠ causation

Сильная correlation в cross-sectional часто обманчива.

Пример: «у людей с высоким доходом больше сбережений». Почему? Из cross-sectional не ясно (богатые копят vs копящие богатеют).

3. Selection bias

Нет контроля за тем, кто попал в snapshot.

Проблемы longitudinal

1. Attrition

Часть объектов уходит. Оставшиеся не репрезентативны.

2. Стоимость

Долго собирать. Для 5 лет — 5 лет ждать.

3. Privacy

Tracking пользователей во времени — приватные риски.

4. Технически сложнее

Обработка panel data ≠ просто SELECT.

Идеальное сочетание

В продукте обычно:

  • Cross-sectional для быстрых ответов («сколько сейчас?»)
  • Longitudinal для глубокого анализа («как меняется?»)

На собесе

«Разница cross-sectional и longitudinal?» Cross-sectional — один момент. Longitudinal — одни объекты во времени.

«Пример каждого?» Cross: MAU на сегодня. Longitudinal: retention curve когорты.

«Когда cross-sectional недостаточно?» Когда нужны тренды, изменения, причинно-следственные связи.

«Problem longitudinal?» Attrition, privacy, стоимость.

Частые ошибки

1. Делать выводы о changes из cross-sectional

«В 2026 у нас revenue 10M. Пять лет назад было 2M → рост 5×». Без longitudinal — просто snapshots.

2. Survivorship в longitudinal

Analysis только по остающимся в выборке. Ушедшие не учтены.

3. Cross-sectional без snapshot timing

«Выборка с февраля до апреля» — это уже не pure cross-sectional.

4. Смешивать cross-sectional и panel в анализе

Разные методы. Нельзя просто GROUP BY.

Longitudinal в продукте

Tracking поведения

События с user_id + timestamp → panel data.

Retention table

Когорта × период — longitudinal analysis.

Churn prediction

Фичи: активность за последние 7, 30, 90 дней (longitudinal).

LTV

Платежи одного пользователя во времени.

Связанные темы

FAQ

Панельные данные = longitudinal?

В основном да. Panel = longitudinal со structured формой (объекты × время).

Cohort — это longitudinal?

Да. Одни и те же пользователи наблюдаются во времени.

Cross-sectional можно использовать для A/B?

Да, но только для снимка результата. Для изучения как reaction меняется во времени — longitudinal.

Survey в году — cross-sectional?

Если разный опрос каждый год (разные респонденты) — repeated cross-sectional. Если одни люди — longitudinal panel.


Тренируйте аналитику — откройте тренажёр с 1500+ вопросами для собесов.