Собеседование на BI-разработчика в Кинопоиск
Содержание:
Почему Кинопоиск — особенный работодатель для BI
Кинопоиск — крупнейший медиапортал и VOD-сервис в РФ, часть экосистемы Яндекса. Десятки миллионов активных пользователей, библиотека из сотен тысяч единиц контента, интеграция с подпиской Яндекс Плюс. Для BI-разработчика контекст специфический: всё внутри Яндекс-экосистемы, поэтому стек существенно отличается от рыночного — вместо Power BI и стандартного SQL тут DataLens, YQL, ClickHouse, YT (YTSaurus).
Контекст BI-инженера специфический: дашборды смотрят продакты, аналитики, content-команда (закупка контента, собственное производство), маркетинг, advertising-команда. Метрики делятся на engagement (watch time, completion rate, sessions per user, retention curves) и бизнес (revenue от подписки, ARPU, churn). Дополнительно — рекламная модель в AVOD-сегменте (CPM, fill rate). Из-за интеграции с Плюсом часть отчётов работает в кросс-сервисной логике.
Стек: DataLens как основной BI-инструмент Яндекса, YQL как язык запросов (поверх YT/YTSaurus), ClickHouse для горячих витрин, YT для тяжёлых ETL и исторических агрегатов. Это значит — нужно знать или быстро освоить YQL (диалект SQL с расширениями для batch-обработки) и понимать особенности DataLens (datasets, чарты, formula language).
Актуальные вакансии — на hh.ru и сайте Яндекса.
Информация основана на публичных источниках и опыте кандидатов. Команды Кинопоиска используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
Полный цикл — 2-3 недели и 4-5 этапов: скрининг, SQL/YQL deep dive, DataLens, дашборд-кейс, поведенческое с Yandex Values.
1. HR-скрининг (30-45 минут)
Рекрутер проверяет твой опыт с DataLens или другими BI-инструментами, SQL, готовность освоить YQL. Опыт в media/streaming, у Яндекс-партнёров или внутри экосистемы — большой плюс. Готовь питч на 90 секунд: что строил, для какой аудитории, какие метрики.
2. SQL deep dive (60-90 минут)
Глубокая SQL/YQL-секция: оконные функции (для retention curves, sessionization), сложные JOIN, оптимизация в ClickHouse (PREWHERE, материализованные view, sampling), особенности YQL (lazy evaluation, work с YT-таблицами, MapReduce-стиль). Бывают задачи на расчёт retention, ARPPU, sessions per user, content performance.
Подготовка: SQL для BI.
3. DataLens (60 минут)
Глубокая секция: datasets и связи, формульный язык DataLens, оконные функции в DataLens, RLS, оптимизация запросов, embedded-отчёты для внешних потребителей. В отличие от Power BI/Tableau тут другая логика — DataLens ближе к SQL-first инструментам, и нужно понимать, как формулы транслируются в запросы к источнику.
Подготовка: DataLens на собесе BI.
4. Дашборд-кейс (90 минут)
Тебе дают задание: «спроектируй дашборд engagement + retention для продакта Кинопоиска». Нужно выбрать ключевые метрики (DAU/MAU, watch time per user, retention curve, sessions, content engagement), сегментацию (платформы, гео, новые vs давние), drill-down от уровня сервиса к конкретным шоу и пользовательским когортам. Слабые ответы — десятки KPI; сильные — выстроенная иерархия и понимание, как продакт принимает решения.
Подготовка: Dashboard design, data modeling для BI.
5. Поведенческое (45 минут)
Финальная встреча с тимлидом. STAR-формат, плюс проверка Yandex Values — ownership, фокус на пользе пользователю, готовность копать. Расскажи про конфликт с продактом, факап с витриной, защиту архитектурного решения.
Особенности по командам
Engagement / Watch time. Ядро BI-аналитики: метрики просмотра контента — total watch time, completion rate, drop-off на разных моментах, переключения между шоу, frequency сессий. Дашборды критичны для продакт-менеджеров и content-команды. Подойдёт BI с интересом к event-аналитике и большому объёму поведенческих данных.
Subscription funnel. Воронка Плюса: триал → платная подписка → продление → отписка. Метрики conversion на каждом этапе, retention M1/M3/M12, LTV, ARPU подписчика. Тесная связка с маркетингом и кросс-сервисной аналитикой (Плюс работает с Музыкой, Едой, Кинопоиском). Подходит BI с опытом в SaaS-funnel или subscription-метриках.
Content. Аналитика контента: какие тайтлы лучше работают по retention, ROI закупленного и собственного контента, востребованность жанров, эффективность подборок и рекомендаций. Подходит BI с интересом к media-индустрии и пониманием, что контент — главный driver продукта.
Advertising. AVOD-сегмент (рекламная модель в бесплатном слое): CPM, fill rate, viewability, ad impressions per session. Связка с Яндекс-рекламным стеком. Подходит инженерам с опытом в ad-tech.
Платформа / Data. Core data team: обслуживает витрины Кинопоиска, обеспечивает консистентность event-pipeline между платформами (web, мобильные, Smart TV, ТВ-приставки). Много YT, dbt-аналогов в Яндекс-экосистеме (Nirvana), контроль качества событий.
Что Кинопоиск ценит в BI
YQL уверенно. Главная техническая компетенция, отличающая Кинопоиск от рыночных вакансий. Слабый ответ: «не работал с YQL, но знаю SQL». Сильный: «писал на YQL запросы к YT-таблицам в петабайт-объёме, использовал PRAGMA для оптимизации, переписал расчёт retention curve через UDF, ускорил расчёт с 40 минут до 12».
DataLens. Не «делал визуалы», а понимание модели datasets, формул, оптимизации. Слабый ответ: «делал чарты». Сильный: «построил dataset на 5 источниках с расчётными полями, оптимизировал тяжёлые формулы через материализацию агрегатов, ускорил дашборд с 30 секунд до 5».
Media / streaming domain. Понимание VOD-метрик. Слабый ответ: «считал просмотры». Сильный: «строил retention curve по платформе и контентной категории, выявил, что на Smart TV retention M3 в 1.6 раза выше, дал гипотезу про разный сценарий потребления».
Engagement / retention метрики. Знание ключевых streaming-метрик. Слабый ответ: «считал DAU». Сильный: «декомпозировал retention на time-to-first-content, completion rate первого шоу, частоту сессий в первой неделе, нашёл leading-индикаторы оттока».
RLS / compliance. Безопасность данных. Слабый ответ: «не работал с RLS». Сильный: «реализовал RLS в DataLens по командам и регионам, добавил обезличивание PII в dev-средах, документировал privacy-impact».
Как готовиться: план
За 4-6 недель до планируемого собеса:
- Неделя 1-2 — SQL + YQL. Оконные функции, sessionization, оптимизация в ClickHouse, освоить базовый YQL (документация Яндекса, демо-туториалы). Параллельно — прорешай вопросы по SQL в Карьернике: 1500+ задач с разбивкой по темам, по 10-15 минут в день закрывают пробелы перед собесом. SQL для BI.
- Неделя 3 — DataLens. Datasets, формулы, RLS, оптимизация. Сделать pet-проект на публичных данных. DataLens.
- Неделя 4 — Dashboard design. Принципы Stephen Few, разбор стриминг-дашбордов (Netflix Tech, Spotify, статьи Яндекса). Dashboard design.
- Неделя 5 — Data modeling. Star schema под streaming, sessionization, SCD для контентного каталога. Data modeling.
- Неделя 6 — Mocks + behavioral. Mock-интервью с фокусом на Yandex Values.
Частые ошибки
Слабый SQL. Кандидат говорит «писал SELECT» — слабо. Сильный кандидат: «оптимизировал расчёт sessions на 3Б событий в YT/ClickHouse через материализованную view по часу и платформе, ускорил с 5 минут до 12 секунд».
DataLens поверхностно. Кандидат знает только чарты, не понимает модель datasets — отсев. Сильный кандидат рисует ER-диаграмму datasets с указанием cardinality, показывает оптимизацию формул.
Без streaming / media domain. Кандидат не понимает разницы между watch time и CTR — слабо. Сильный кандидат декомпозирует engagement на компоненты и предлагает leading-индикаторы.
Без engagement / retention. Кандидат показывает только выручку по месяцам — слабо. Сильный кандидат строит retention curve, cohort heatmap, ARPU по сегментам, связывая с engagement.
Перегруз чартами. 25 KPI на одном экране — слабо. Сильный кандидат строит top-level и drill-down, в каждом экране 1-2 главных вопроса.
Связанные темы
- Собеседование на BI-разработчика
- SQL для BI
- DataLens на собесе BI
- Power BI на собесе BI
- Dashboard design
- Data modeling для BI
FAQ
Удалёнка в Кинопоиске для BI?
Гибрид и удалёнка распространены, для middle+ часто возможна полная удалёнка. Офисы в Москве.
Зарплатные вилки 2026?
Middle BI: 240-340k. Senior: 340-490k. Lead-уровень — выше, зависит от грейда.
Английский нужен?
Базовый — желательно для чтения документации. Для большинства команд разговорный не критичен.
Сколько этапов?
4-5 этапов, 2-3 недели от первого скрининга до оффера. Может растягиваться до 4-6 недель из-за внутренних согласований Яндекса.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.