Kalman filter на собеседовании Data Scientist
Карьерник — Duolingo для аналитиков: 10 минут в день тренируй SQL, Python, A/B, статистику, метрики и ещё 3 темы собеса. 1500+ вопросов в Telegram-боте. Бесплатно.
Содержание:
Зачем разбирать на собесе
Kalman — классика sensor fusion / time series. На собесе DS / robotics: «как work», «когда EKF».
State space model
State: x_t (e.g., position, velocity)
Observation: z_t (noisy sensor reading)
Transition: x_t = A·x_{t-1} + B·u_{t-1} + w_t (w ~ N(0, Q))
Observation: z_t = H·x_t + v_t (v ~ N(0, R))Linear, Gaussian noise.
Predict step
Использовать model для prediction следующего state.
x̂_t|t-1 = A · x̂_{t-1|t-1} + B · u_{t-1}
P_t|t-1 = A · P_{t-1|t-1} · A^T + QP — covariance of state estimate. Растёт с predict (uncertainty accumulates).
Update step
Combine prediction с observation.
K = P_t|t-1 · H^T · (H · P_t|t-1 · H^T + R)^(-1) (Kalman gain)
x̂_t|t = x̂_t|t-1 + K · (z_t - H · x̂_t|t-1)
P_t|t = (I - K·H) · P_t|t-1K — weight для observation vs prediction. Если observation precise (R small) → K close to 1. Если model precise (P small) → K close to 0.
EKF / UKF / particle
Kalman filter assumes linear + Gaussian. Реальный мир — нет.
Extended Kalman Filter (EKF). Linearization Taylor — работает на mildly non-linear.
Unscented Kalman Filter (UKF). Sample sigma points, propagate, recompute. Better чем EKF на сильно non-linear.
Particle filter. Monte Carlo — sample huge number particles, propagate. Handles arbitrary distributions / non-linear.
Применения
Robotics. Sensor fusion (GPS + IMU + odometry → position).
Aerospace. Tracking objects, missile guidance.
Finance. State-space models для volatility (e.g., stochastic vol).
Computer Vision. Object tracking (kalman + Hungarian assignment).
Time series forecasting. Структурированные models (e.g., Bayesian structural time series).
В DS production — реже, чем boosting / DL. Но в robotics, signal processing — стандарт.
Связанные темы
- Bayesian методы для DS
- ARIMA на собесе DS
- Holt-Winters для DS
- Time series CV и features для DS
- Подготовка к собесу Data Scientist
FAQ
Это официальная информация?
Нет. Статья основана на классике (Kalman 1960).
Тренируйте Data Science — откройте тренажёр с 1500+ вопросами для собесов.