Domain adaptation на собеседовании Data Scientist

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Карьерник — Duolingo для аналитиков: 10 минут в день тренируй SQL, Python, A/B, статистику, метрики и ещё 3 темы собеса. 1500+ вопросов в Telegram-боте. Бесплатно.

Зачем domain adaptation

Train на source domain (много labeled). Apply на target domain (different distribution).

Examples:

  • Sentiment model на product reviews → applied на tweets.
  • Object detection на synthetic data → real images.
  • Sales prediction на USA → adapt to Russia.

Без adaptation — accuracy drops significantly.

Setting types

Supervised DA. Target имеет labels (мало). Standard fine-tuning.

Unsupervised DA. Target — только unlabeled. Сложнее.

Semi-supervised DA. Target часть labeled, часть unlabeled.

Domain generalization. Train на multiple sources, evaluate на unseen domain.

Fine-tuning strategies

Full fine-tune. Update all weights с small learning rate.

Linear probe. Freeze backbone, train classifier head. Good если target small.

LoRA. Add adapter, update only adapters.

Layer-wise. Freeze early layers (general features), tune later (domain-specific).

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

DANN

Domain-Adversarial Neural Network. Add domain classifier с gradient reversal.

Feature extractor → label classifier (helps task)
                  → domain classifier (gradient reversed, makes features domain-invariant)

Forces features that don't reveal source / target domain — generalize.

MMD

Maximum Mean Discrepancy. Measure distance между distributions в RKHS.

Loss penalize feature distributions source vs target — push close.

L = task_loss + λ · MMD(features_source, features_target)

Used в transfer learning, generative models.

Связанные темы

FAQ

Это официальная информация?

Нет. Статья основана на работах Ganin 2015 (DANN), Long 2015 (MMD).


Тренируйте Data Science — откройте тренажёр с 1500+ вопросами для собесов.