Question 1

У вас есть база email, которая покрывает только 70% пользователей. Как лучше всего назвать эту базу в контексте построения `sample`?

Accepted Answer

Список, из которого вы отбираете `sample`, может быть неполным относительно `population` и это важно явно фиксировать. Даже при случайном отборе внутри базы вы не получите репрезентативность для тех, кого в базе нет. Это ограничение покрытия, которое может приводить к смещённым выводам. Типичная ловушка — воспринимать доступный список как полную `population` и не замечать, кого он исключает.

Question 2

Вы случайно отбираете для анализа не пользователей, а сессии (каждая сессия равновероятна попасть в `sample`). Какой риск для оценки среднего числа сессий на пользователя?

Accepted Answer

Важно выбирать правильную единицу отбора: `sample` по сессиям даёт другой объект оценки, чем по пользователям. Пользователи с большим числом сессий попадают в выборку чаще, поэтому выборка по сессиям смещена в сторону более активных пользователей. Если ваша цель — среднее по пользователям, нужно отбирать пользователей или корректировать веса. Типичная ловушка — считать, что «случайная» выборка всегда репрезентативна для любой метрики.

Question 3

Вы измеряете удовлетворённость поддержкой и отправляете опрос только пользователям, у которых тикет закрыт статусом 'resolved'. Какой bias наиболее вероятен?

Accepted Answer

Если попадание в опрос зависит от исхода процесса, возникает `selection bias`. Пользователи с нерешёнными проблемами или эскалациями исключаются из `sample`, поэтому средняя оценка может быть завышена относительно всей `population` обращений. Корректнее включать все обращения или анализировать удовлетворённость по стадиям. Типичная ошибка — мерить качество только по «закрытым успешно» кейсам и принимать это за общую картину.

Question 4

Если `measurement error` является случайным и имеет нулевое среднее (например, `E[error]=0`), то какое влияние он чаще всего оказывает на оценку среднего значения метрики?

Accepted Answer

Случайный `measurement error` обычно повышает шум, но не создаёт систематическое смещение среднего. Если ошибка измерения симметрична и в среднем равна нулю, то среднее значение не смещается, но становится менее точным из-за большей дисперсии. На практике это ухудшает доверительные интервалы и снижает чувствительность анализов. Типичная ошибка — путать случайный шум и систематическую ошибку, которая действительно смещает оценки.

Question 5

В A/B тесте фича работает только у пользователей с новой версией приложения, а обновляются быстрее более активные пользователи. Что лучше проверить первым, чтобы понять риск смещения?

Accepted Answer

Если попадание в тест зависит от поведения, возможен `selection bias` и нужно проверить состав выборки. Когда фича доступна не всем, фактическая `population` теста сужается до обновившихся, и это может зависеть от активности. Даже при рандомизации внутри этой подгруппы выводы могут не переноситься на всех пользователей. Типичная ошибка — считать, что тест измеряет эффект на всей аудитории, хотя на самом деле измеряется эффект на подвыборке.

Выборка и смещение: вопросы для собеседования (часть 2)

Вопросы 6–10 из 20

Хотите тренировать интерактивно?

Другие темы: Статистика