Вы включили семплирование 10% для высокочастотного события scrollinstrumentation оно отправляется не всегда). Как сделать так, чтобы аналитика и data quality не пострадали?

AНичего не делать: семплирование не влияет на выводы, потому что выборка большая.
BЛогировать sample_rate в properties и использовать веса при расчётах, а критичные для user journey события не семплировать.
CУбрать sample_rate, чтобы не путать аналитиков, и считать как обычные события.
DСемплировать только «плохих» пользователей, чтобы быстрее находить проблемы.
Правильный ответ. При семплировании важно фиксировать sample_rate и не семплировать события, которые являются основой воронок и инвариантов.

Разбор

Без знания sample_rate вы не сможете корректно восстанавливать оценки и сравнивать периоды. Для событий поведения вроде scroll семплирование может быть нормальным, но для событий успеха и шагов user journey оно ломает конверсии и invariants. Поэтому обычно разделяют: высокочастотные события можно семплировать, а ключевые — нет. Явная фиксация семплирования делает расчёты воспроизводимыми и защищает data quality.

Проверь себя · 1/3разбор после ответа
Вы описываете event taxonomy для purchase_succeeded. Как лучше хранить сумму покупки в properties, чтобы избежать проблем data quality при агрегациях?
Тренировать продукт в Telegram

Ещё вопросы по теме «Инструментация и качество данных»