7 мая 2026 г.·2 мин чтения

Data tiering на собеседовании Data Engineer

Q: Это официальная информация?

Нет. Статья основана на индустриальных storage practices. --- Тренируйте Data Engineering — [откройте тренажёр](https://t.me/kariernik_bot/app?startapp=web_blog_data-tiering-na-sobesedovanii-de) с 1500+ вопросами для собесов.

Проверь себя · 1/3разбор после ответа

Нужно выбрать заказы за декабрь 2025 из таблицы заказов по полю created_at с временем. Какой фильтр надёжнее задаёт диапазон «весь месяц» без потерь по краям?

Содержание:

Зачем tiering
Hot tier
Warm tier
Cold tier
Lifecycle policies
Связанные темы
FAQ

Зачем tiering

Storage costs scale с data volume. Не all data accessed equally.

Recent data = hot (queried часто). Old data = cold (rare access).

Tiered storage — match data access pattern с storage cost.

Hot tier

Storage: SSD, NVMe, в-memory caches.

Latency: ms.

Cost: highest per GB.

Use case:

Recent data (last 30 days).
Frequently accessed.
Active dashboards.

Examples: Postgres, ClickHouse hot tables, Redis cache, S3 Standard.

Warm tier

Storage: HDD, S3 Standard-IA.

Latency: seconds.

Cost: medium.

Use case:

1-12 months old.
Less frequent queries.
Reporting на end of month.

Готовься к собесу аналитика как в Duolingo

10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram

Открыть Карьерник в Telegram

Cold tier

Storage: S3 Glacier, tape, archive.

Latency: minutes-hours retrieval.

Cost: cheapest. 80-90% off hot.

Use case:

1 year old.
Compliance retention (financial, regulatory).
Disaster recovery.

Lifecycle policies

Auto-move data between tiers.

S3 lifecycle:

{
  "Rules": [{
    "Status": "Enabled",
    "Transitions": [
      {"Days": 30, "StorageClass": "STANDARD_IA"},
      {"Days": 90, "StorageClass": "GLACIER"},
      {"Days": 365, "StorageClass": "DEEP_ARCHIVE"}
    ]
  }]
}

ClickHouse TTL.

ALTER TABLE events MODIFY TTL
  event_date + INTERVAL 30 DAY TO VOLUME 'warm',
  event_date + INTERVAL 90 DAY TO VOLUME 'cold',
  event_date + INTERVAL 365 DAY DELETE;

Iceberg. Partition-level compaction / archival.

Связанные темы

FAQ

Это официальная информация?

Нет. Статья основана на индустриальных storage practices.

Тренируйте Data Engineering — откройте тренажёр с 1500+ вопросами для собесов.

Data tiering на собеседовании Data Engineer

Зачем tiering

Hot tier

Warm tier

Cold tier

Lifecycle policies

Связанные темы

FAQ

Это официальная информация?

Ещё по теме