Question 1

Вы строите 95-процентный доверительный интервал, но в симуляции фактическое покрытие получается около 90 процентов. Какая причина наиболее правдоподобна?

Accepted Answer

Если стандартная ошибка занижена или модель не соответствует данным, фактическое покрытие падает ниже номинального уровня доверия. Уровень доверия задаёт целевое покрытие при корректной модели и корректно оцененной стандартной ошибке. Если стандартная ошибка недооценена (например, не учли зависимость наблюдений) или нарушены предпосылки метода, интервалы получаются слишком узкими. В симуляции это проявляется как покрытие ниже номинального — например, 90 процентов вместо 95.

Question 2

Какое утверждение корректно различает стандартное отклонение и стандартную ошибку среднего?

Accepted Answer

Не путайте разброс данных и неопределённость оценки: это разные величины с разной зависимостью от `n`. Стандартное отклонение описывает разброс отдельных наблюдений, а стандартная ошибка — разброс оценок между повторными выборками. Для среднего обычно стандартная ошибка приблизительно равна `s/√n`, поэтому увеличение `n` уменьшает неопределённость и сужает доверительный интервал. Ошибка — подставлять стандартное отклонение вместо стандартной ошибки и получать завышенную предельную ошибку.

Question 3

У двух кампаний одинаковое число показов и одинаковый уровень доверия при оценке доли конверсий. У какой кампании доверительный интервал для доли будет шире?

Accepted Answer

Для доли стандартная ошибка зависит от `p*(1-p)` и максимальна в районе `p = 0.5`. Для доли дисперсия равна `p*(1-p)`, поэтому стандартная ошибка зависит от самой доли при фиксированном `n`. Максимум `p*(1-p)` достигается около `p = 0.5`, поэтому именно там неопределённость наибольшая. Из-за этого доверительный интервал для конверсии около 50% обычно шире, чем для очень малой конверсии при том же числе наблюдений. Уровень доверия влияет на ширину через множитель, но при фиксированном уровне сама доля тоже меняет ширину.

Question 4

Вы измеряете CTR по кликам и показам, но считаете каждый показ независимым, хотя у одного пользователя их много. Какой эффект это чаще всего даёт на доверительный интервал и его покрытие?

Accepted Answer

Зависимые наблюдения уменьшают эффективный размер выборки, поэтому наивная стандартная ошибка получается заниженной. Если вы берёте много событий от одного пользователя, наблюдения внутри пользователя коррелированы. Наивная формула считает их независимыми и занижает стандартную ошибку, делая доверительный интервал слишком узким. В результате фактическое покрытие падает ниже заявленного уровня, и вы чаще «находите эффекты», которых нет на самом деле.

Question 5

В дашборде можно переключать уровень доверия с 95% на 80%, чтобы интервалы выглядели уже. Какое объяснение корректно?

Accepted Answer

Ниже уровень доверия — уже интервал и больше риск промаха: покрытие процедуры падает с 95% до 80%. 80% уровень доверия делает интервал уже, потому что уменьшается критическое значение и погрешность. Это может быть полезно для разведки и быстрых оценок, но риск промаха выше: покрытие процедуры — 80%, а не 95%. Частая ошибка — трактовать 80% как вероятность того, что истинный параметр попал в конкретный построенный интервал; уровень доверия описывает свойство процедуры, а не одного результата.

Доверительные интервалы: вопросы для собеседования (часть 3)

Вопросы 11–15 из 20

Хотите тренировать интерактивно?

Другие темы: Статистика