Собеседование на BI-разработчика в Кинопоиск

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Кинопоиск — особенный работодатель для BI

Кинопоиск — крупнейший медиапортал и VOD-сервис в РФ, часть экосистемы Яндекса. Десятки миллионов активных пользователей, библиотека из сотен тысяч единиц контента, интеграция с подпиской Яндекс Плюс. Для BI-разработчика контекст специфический: всё внутри Яндекс-экосистемы, поэтому стек существенно отличается от рыночного — вместо Power BI и стандартного SQL тут DataLens, YQL, ClickHouse, YT (YTSaurus).

Контекст BI-инженера специфический: дашборды смотрят продакты, аналитики, content-команда (закупка контента, собственное производство), маркетинг, advertising-команда. Метрики делятся на engagement (watch time, completion rate, sessions per user, retention curves) и бизнес (revenue от подписки, ARPU, churn). Дополнительно — рекламная модель в AVOD-сегменте (CPM, fill rate). Из-за интеграции с Плюсом часть отчётов работает в кросс-сервисной логике.

Стек: DataLens как основной BI-инструмент Яндекса, YQL как язык запросов (поверх YT/YTSaurus), ClickHouse для горячих витрин, YT для тяжёлых ETL и исторических агрегатов. Это значит — нужно знать или быстро освоить YQL (диалект SQL с расширениями для batch-обработки) и понимать особенности DataLens (datasets, чарты, formula language).

Актуальные вакансии — на hh.ru и сайте Яндекса.

Информация основана на публичных источниках и опыте кандидатов. Команды Кинопоиска используют разные процессы — уточняйте у рекрутера.

Этапы собеседования

Полный цикл — 2-3 недели и 4-5 этапов: скрининг, SQL/YQL deep dive, DataLens, дашборд-кейс, поведенческое с Yandex Values.

1. HR-скрининг (30-45 минут)

Рекрутер проверяет твой опыт с DataLens или другими BI-инструментами, SQL, готовность освоить YQL. Опыт в media/streaming, у Яндекс-партнёров или внутри экосистемы — большой плюс. Готовь питч на 90 секунд: что строил, для какой аудитории, какие метрики.

2. SQL deep dive (60-90 минут)

Глубокая SQL/YQL-секция: оконные функции (для retention curves, sessionization), сложные JOIN, оптимизация в ClickHouse (PREWHERE, материализованные view, sampling), особенности YQL (lazy evaluation, work с YT-таблицами, MapReduce-стиль). Бывают задачи на расчёт retention, ARPPU, sessions per user, content performance.

Подготовка: SQL для BI.

3. DataLens (60 минут)

Глубокая секция: datasets и связи, формульный язык DataLens, оконные функции в DataLens, RLS, оптимизация запросов, embedded-отчёты для внешних потребителей. В отличие от Power BI/Tableau тут другая логика — DataLens ближе к SQL-first инструментам, и нужно понимать, как формулы транслируются в запросы к источнику.

Подготовка: DataLens на собесе BI.

4. Дашборд-кейс (90 минут)

Тебе дают задание: «спроектируй дашборд engagement + retention для продакта Кинопоиска». Нужно выбрать ключевые метрики (DAU/MAU, watch time per user, retention curve, sessions, content engagement), сегментацию (платформы, гео, новые vs давние), drill-down от уровня сервиса к конкретным шоу и пользовательским когортам. Слабые ответы — десятки KPI; сильные — выстроенная иерархия и понимание, как продакт принимает решения.

Подготовка: Dashboard design, data modeling для BI.

5. Поведенческое (45 минут)

Финальная встреча с тимлидом. STAR-формат, плюс проверка Yandex Values — ownership, фокус на пользе пользователю, готовность копать. Расскажи про конфликт с продактом, факап с витриной, защиту архитектурного решения.

Особенности по командам

Engagement / Watch time. Ядро BI-аналитики: метрики просмотра контента — total watch time, completion rate, drop-off на разных моментах, переключения между шоу, frequency сессий. Дашборды критичны для продакт-менеджеров и content-команды. Подойдёт BI с интересом к event-аналитике и большому объёму поведенческих данных.

Subscription funnel. Воронка Плюса: триал → платная подписка → продление → отписка. Метрики conversion на каждом этапе, retention M1/M3/M12, LTV, ARPU подписчика. Тесная связка с маркетингом и кросс-сервисной аналитикой (Плюс работает с Музыкой, Едой, Кинопоиском). Подходит BI с опытом в SaaS-funnel или subscription-метриках.

Content. Аналитика контента: какие тайтлы лучше работают по retention, ROI закупленного и собственного контента, востребованность жанров, эффективность подборок и рекомендаций. Подходит BI с интересом к media-индустрии и пониманием, что контент — главный driver продукта.

Advertising. AVOD-сегмент (рекламная модель в бесплатном слое): CPM, fill rate, viewability, ad impressions per session. Связка с Яндекс-рекламным стеком. Подходит инженерам с опытом в ad-tech.

Платформа / Data. Core data team: обслуживает витрины Кинопоиска, обеспечивает консистентность event-pipeline между платформами (web, мобильные, Smart TV, ТВ-приставки). Много YT, dbt-аналогов в Яндекс-экосистеме (Nirvana), контроль качества событий.

Что Кинопоиск ценит в BI

YQL уверенно. Главная техническая компетенция, отличающая Кинопоиск от рыночных вакансий. Слабый ответ: «не работал с YQL, но знаю SQL». Сильный: «писал на YQL запросы к YT-таблицам в петабайт-объёме, использовал PRAGMA для оптимизации, переписал расчёт retention curve через UDF, ускорил расчёт с 40 минут до 12».

DataLens. Не «делал визуалы», а понимание модели datasets, формул, оптимизации. Слабый ответ: «делал чарты». Сильный: «построил dataset на 5 источниках с расчётными полями, оптимизировал тяжёлые формулы через материализацию агрегатов, ускорил дашборд с 30 секунд до 5».

Media / streaming domain. Понимание VOD-метрик. Слабый ответ: «считал просмотры». Сильный: «строил retention curve по платформе и контентной категории, выявил, что на Smart TV retention M3 в 1.6 раза выше, дал гипотезу про разный сценарий потребления».

Engagement / retention метрики. Знание ключевых streaming-метрик. Слабый ответ: «считал DAU». Сильный: «декомпозировал retention на time-to-first-content, completion rate первого шоу, частоту сессий в первой неделе, нашёл leading-индикаторы оттока».

RLS / compliance. Безопасность данных. Слабый ответ: «не работал с RLS». Сильный: «реализовал RLS в DataLens по командам и регионам, добавил обезличивание PII в dev-средах, документировал privacy-impact».

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

За 4-6 недель до планируемого собеса:

  1. Неделя 1-2 — SQL + YQL. Оконные функции, sessionization, оптимизация в ClickHouse, освоить базовый YQL (документация Яндекса, демо-туториалы). Параллельно — прорешай вопросы по SQL в Карьернике: 1500+ задач с разбивкой по темам, по 10-15 минут в день закрывают пробелы перед собесом. SQL для BI.
  2. Неделя 3 — DataLens. Datasets, формулы, RLS, оптимизация. Сделать pet-проект на публичных данных. DataLens.
  3. Неделя 4 — Dashboard design. Принципы Stephen Few, разбор стриминг-дашбордов (Netflix Tech, Spotify, статьи Яндекса). Dashboard design.
  4. Неделя 5 — Data modeling. Star schema под streaming, sessionization, SCD для контентного каталога. Data modeling.
  5. Неделя 6 — Mocks + behavioral. Mock-интервью с фокусом на Yandex Values.

Частые ошибки

Слабый SQL. Кандидат говорит «писал SELECT» — слабо. Сильный кандидат: «оптимизировал расчёт sessions на 3Б событий в YT/ClickHouse через материализованную view по часу и платформе, ускорил с 5 минут до 12 секунд».

DataLens поверхностно. Кандидат знает только чарты, не понимает модель datasets — отсев. Сильный кандидат рисует ER-диаграмму datasets с указанием cardinality, показывает оптимизацию формул.

Без streaming / media domain. Кандидат не понимает разницы между watch time и CTR — слабо. Сильный кандидат декомпозирует engagement на компоненты и предлагает leading-индикаторы.

Без engagement / retention. Кандидат показывает только выручку по месяцам — слабо. Сильный кандидат строит retention curve, cohort heatmap, ARPU по сегментам, связывая с engagement.

Перегруз чартами. 25 KPI на одном экране — слабо. Сильный кандидат строит top-level и drill-down, в каждом экране 1-2 главных вопроса.

Связанные темы

FAQ

Удалёнка в Кинопоиске для BI?

Гибрид и удалёнка распространены, для middle+ часто возможна полная удалёнка. Офисы в Москве.

Зарплатные вилки 2026?

Middle BI: 240-340k. Senior: 340-490k. Lead-уровень — выше, зависит от грейда.

Английский нужен?

Базовый — желательно для чтения документации. Для большинства команд разговорный не критичен.

Сколько этапов?

4-5 этапов, 2-3 недели от первого скрининга до оффера. Может растягиваться до 4-6 недель из-за внутренних согласований Яндекса.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.