Есть список из 100 000 заблокированных `user_id` в переменной `banned`. Для каждого из миллиона событий нужно проверить, заблокирован ли пользователь. Как ускорить проверку?

Question

Карьерник · Accepted Answer

Правильный ответ: Преобразовать `banned` в `tuple` — проверка `in` у кортежей быстрее, чем у списков. Проверка `x in set` работает за O(1) в среднем, а `x in list` — за O(n). Для массовых проверок множество значительно быстрее. Список проверяет принадлежность последовательным перебором элементов — O(n). Множество использует хеш-таблицу, поэтому проверка `x in s` занимает O(1) в среднем. При 100 000 элементах и миллионе проверок разница огромна. Сортировка списка не помогает: оператор `in` у `list` не использует бинарный поиск — он всегда делает линейный перебор.

Есть список из 100 000 заблокированных `user_id` в переменной `banned`. Для каждого из миллиона событий нужно проверить, заблокирован ли пользователь. Как ускорить проверку?

Разбор

Ещё вопросы по теме «Коллекции и структуры данных»

Есть список из 100 000 заблокированных user_id в переменной banned. Для каждого из миллиона событий нужно проверить, заблокирован ли пользователь. Как ускорить проверку?

Разбор

Ещё вопросы по теме «Коллекции и структуры данных»

Есть список из 100 000 заблокированных `user_id` в переменной `banned`. Для каждого из миллиона событий нужно проверить, заблокирован ли пользователь. Как ускорить проверку?