Snowpipe на собеседовании Data Engineer

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Карьерник — Duolingo для аналитиков: 10 минут в день тренируй SQL, Python, A/B, статистику, метрики и ещё 3 темы собеса. 1500+ вопросов в Telegram-боте. Бесплатно.

Что такое Snowpipe

Snowflake's continuous data ingestion. Files в storage → autoload в table.

Vs traditional COPY. Manual / scheduled — slow.

Snowpipe — within minutes файла arrival.

Auto-ingest

S3 sends event notification → SQS → Snowpipe.

CREATE PIPE my_pipe AUTO_INGEST=TRUE AS
COPY INTO my_table
FROM @my_stage
FILE_FORMAT = (TYPE = PARQUET);

S3 PutObject → automatic load.

Manual REST

client = SnowpipeClient(...)
client.insert_files(['file1.parquet', 'file2.parquet'])

App-controlled. Когда auto-ingest не applies.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Snowpipe Streaming

2023+. Direct row-level ingest без files.

SnowflakeStreamingIngestClient.insert_rows([row1, row2, ...])

Sub-second latency. Replaces Kafka → S3 → Snowpipe pipeline.

Cost

Per file overhead. Many small files — pricey.

Optimize:

  • Aggregate files (target 100MB-1GB).
  • Compress.

Snowpipe credit-based pricing.

Связанные темы

FAQ

Это официальная информация?

Нет. Статья основана на документации Snowflake.


Тренируйте Data Engineering — откройте тренажёр с 1500+ вопросами для собесов.