Вам нужно прикинуть, сколько места займут новые events, но неизвестны точные units: сколько events per user в день и сколько bytes в одном событии. Какой подход к оценке наиболее правильный?

AНе оценивать, пока не появятся точные данные, иначе ответ будет неверным.
BВзять одно число наугад и считать его точным, чтобы быстрее принять решение.
CОпираться только на самый оптимистичный сценарий, потому что он приятнее для бизнеса.
DРазложить на units и построить bounds через lower bound и upper bound по частоте и размеру, фиксируя assumptions и проверяя constraints.
Правильный ответ. Когда данных не хватает, лучше строить bounds через lower bound и upper bound и постепенно уточнять assumptions.

Разбор

Начните с разложения на units: users per day × events per user × bytes per event. Затем задайте консервативные assumptions и получите lower bound и upper bound для итогового объёма. Такой грубая прикидка подход помогает принимать решения под неопределённость и быстро ловить несоответствия constraints. По мере появления данных вы сужаете bounds, не переписывая логику оценки.

Проверь себя · 1/3разбор после ответа
ETL job обработал 120 млн строк за 2 часа. Какой грубая прикидка throughput в rows per second ближе всего?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Sanity-check и оценка»