Собеседование на Data Scientist в Авито
Содержание:
Почему Авито — особенный работодатель для DS
Авито — крупнейшая classifieds-площадка РФ. DS-команда работает над несколькими большими ML-направлениями: search ranking, рекомендации, антифрод, модерация контента, dynamic pricing для pro-продавцов, CV для распознавания изображений в объявлениях.
Стек: Python + PyTorch + scikit-learn + LightGBM + Spark + ClickHouse + MLflow. Авито инвестирует в LLM и computer vision направления.
Актуальные вакансии — на career.avito.ru.
Информация основана на публичных источниках и опыте кандидатов. Команды Авито используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
1. HR-скрининг (30-45 минут)
Знакомство:
- Опыт ML, особенно ranking / recommendation / fraud
- Стек: PyTorch / sklearn / Spark
- Motivation: classifieds / marketplace
Питч 90 секунд: задача, данные, модель, метрика, impact.
2. ML теория (60-90 минут)
- Классика: bias-variance, регуляризация, бустинги
- Ranking metrics: NDCG, MAP, MRR
- Recommendation: CF, content-based, hybrid
- A/B-тесты ML моделей
Подготовка: ML-теория на собесе DS.
3. Python + SQL (60-90 минут)
Live coding.
- Pandas / NumPy
- SQL window functions, оптимизация
- Алгоритмы medium
Подготовка: Python для DS, SQL-тренажёр.
4. ML System Design (60-90 минут)
Кейсы:
- Ranking для search
- Recommendation для homepage
- Fraud detection в реальном времени
- Модерация контента (CV / NLP)
Подготовка: ML system design, feature engineering.
5. Поведенческое (45-60 минут)
STAR: cross-team, ML in production, trade-offs.
Особенности по командам
Search & Ranking: core ranking, ML features, A/B-тесты.
Recommendations: homepage, related items, push.
Антифрод: real-time inference, low-latency.
Модерация: NLP / CV для авто-модерации объявлений.
Pro / B2B: аналитика для продавцов, dynamic pricing.
Что Авито ценит в DS
- Ranking / Recommendation опыт. Core для Авито.
- Production ML. Не notebook-only, а deployment.
- A/B-тесты. Дизайн + анализ.
- Classifieds domain. Понимание search, fraud, модерация.
- Communication. Cross-team: PM, engineers, антифрод.
Как готовиться: план
За 4-6 недель:
- Неделя 1-2 — ML теория + Ranking. Бустинги, ranking metrics. ML-теория.
- Неделя 3 — Python + SQL. Live coding. Python для DS.
- Неделя 4 — System design. Marketplace кейсы. ML system design.
- Неделя 5 — A/B + production. A/B-тесты для DS.
- Неделя 6 — Mocks + behavioral.
Частые ошибки
- Без ranking / recommendation опыта. Авито core.
- Без production. Только эксперименты — спросят deployment.
- «У меня deep learning». LightGBM + features часто beats. Pragmatism.
- Игнор A/B. Спросят дизайн — придётся отвечать.
- Слабый SQL. Feature engineering чаще в SQL.
Связанные темы
- Собеседование на Data Scientist
- ML-теория на собесе DS
- ML system design
- Feature engineering
- A/B-тесты для DS
- Python для DS
FAQ
Удалёнка в Авито для DS?
Гибрид часто. Полная для senior возможно.
Зарплатные вилки 2026?
Middle DS: 260-380k. Senior: 380-580k.
Английский нужен?
Базовый желательно.
Сколько этапов?
4-5 этапов, 2-3 недели.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.