Вы фильтруете большой поток строк rows. Почему генератор def valid(rows): for row in rows: if is_valid(row): yield row часто лучше по памяти, чем [row for row in rows if is_valid(row)]?
AПотому что
yield автоматически кэширует все строки на диске.BПотому что list comprehension нельзя использовать в
for.CПотому что генератор отдаёт элементы по одному и не хранит весь результат сразу в памяти.
DПотому что генератор гарантированно работает быстрее списка в любом случае.
Правильный ответ. Генератор через
yield — потоковый: позволяет обрабатывать данные постепенно без полной материализации.Разбор
List comprehension создаёт список всех валидных строк сразу, что может быть дорого по памяти. Генератор с yield выдаёт элементы по одному, поэтому вы можете сразу передавать их в следующий шаг пайплайна (for row in valid(rows): ...) без хранения всего набора. Это типичный приём для экономии памяти на больших логах.
Проверь себя · 1/3разбор после ответа
Что произойдёт при выполнении
it = iter([]) и затем next(it)?Ещё вопросы по теме «Итераторы и генераторы»
- Есть `xs = [1, 2, 3]` и `it = iter(xs)`. Сначала выполняется `a = list(it)`, а затем `b = list(it)`. Чему равно `b`?
- Есть `it = iter(['a', 'b'])`. Что вернёт вызов `next(it)`?
- Дан генератор: `def gen(): print('A'); yield 1; print('B'); yield 2`. Сразу после `g = gen()` что будет выведено в консоль?
- Что создаёт выражение `squares = (x * x for x in xs)`?
- В отладке вы сделали `pairs = zip(users, spends)`, затем `debug = list(pairs)`. После этого `d = dict(pairs)` оказался пустым. Почему?
- Все вопросы по «Итераторы и генераторы» →