Вы фильтруете большой поток строк `rows`. Почему генератор `def valid(rows): for row in rows: if is_valid(row): yield row` часто экономнее по памяти, чем выражение `[row for row in rows if is_valid(row)]`?

Question

Карьерник · Accepted Answer

Правильный ответ: Генератор отдаёт строки по одной и не хранит весь набор в памяти, а сразу передаёт следующему шагу обработки.. Генератор лениво выдаёт элементы по одному, не материализуя весь набор в памяти. Когда `valid(rows)` написана через `yield`, она запускает обработку одной строки за раз: вернула значение, остановилась, ждёт следующего `next()`. Список же сначала собирает все строки целиком в памяти, а затем уже отдаёт их следующему шагу. На больших потоках это и даёт экономию памяти, особенно при чтении из файла или БД. Никакого автоматического сброса на диск `yield` не делает, и по скорости генератор не всегда выигрывает: если данные обходятся несколько раз, заранее построенный список может быть выгоднее.

Вы фильтруете большой поток строк `rows`. Почему генератор `def valid(rows): for row in rows: if is_valid(row): yield row` часто экономнее по памяти, чем выражение `[row for row in rows if is_valid(row)]`?

Разбор

Ещё вопросы по теме «Итераторы и генераторы»

Вы фильтруете большой поток строк rows. Почему генератор def valid(rows): for row in rows: if is_valid(row): yield row часто экономнее по памяти, чем выражение [row for row in rows if is_valid(row)]?

Разбор

Ещё вопросы по теме «Итераторы и генераторы»

Вы фильтруете большой поток строк `rows`. Почему генератор `def valid(rows): for row in rows: if is_valid(row): yield row` часто экономнее по памяти, чем выражение `[row for row in rows if is_valid(row)]`?