Вы строите ключ для дедупликации email и хотите устранить три источника «ложных разных» значений: пробелы по краям, разный регистр и точки в локальной части (для Gmail-подобных адресов). Какое выражение учитывает все три фактора?
A
LOWER(TRIM(email)) без удаления точек из локальной части адресаB
LOWER(TRIM(REPLACE(email, '.', ''))) со снятием пробелов и точекC
UPPER(TRIM(email)) с приведением символов к верхнему региструD
TRIM(REPLACE(email, '.', '')) без приведения букв к одному региструПравильный ответ. Для нормализации email комбинируют
TRIM, LOWER и REPLACE для удаления точек.Разбор
Пробелы по краям, разный регистр и точки в локальной части — частые причины ложных дубликатов. LOWER(TRIM(REPLACE(email, '.', ''))) устраняет все три источника шума: TRIM снимает пробелы, REPLACE убирает точки, LOWER приводит к единому регистру. Только LOWER(TRIM(...)) или UPPER(TRIM(...)) оставляет точки и сохранит j.smith@gmail.com отдельно от jsmith@gmail.com. Без LOWER сохраняется чувствительность к регистру.
Проверь себя · 1/3разбор после ответа
В таблице
products код товара хранится как текст, например 00123 (важны ведущие нули). Вы хотите соединить её с catalog(code) (тоже текст). Какое действие чаще всего приводит к багу и пропущенным совпадениям?Ещё вопросы по теме «Строки и приведение типов»
- У вас есть таблицы `users(email)` и `marketing_signups(email)`. В одной системе email сохраняется как `Ivan@Example.com`, в другой — `ivan@example.com`. Какой подход в `JOIN` чаще всего решает проблему без изменения данных в таблицах?
- В таблице `products` категория хранится как `Books`, `books`, `BOOKS`. Нужно одним условием в `WHERE` отобрать все варианты категории «книги». Какой фильтр наиболее надёжен?
- В отчёте по городам вы делаете агрегацию по `city`, но видите две строки: `Moscow` и `Moscow ` (с пробелом в конце). Как исправить это прямо в запросе?
- Поле `price_text` хранит цены как текст: `2`, `10`, `100`. Аналитик написал `WHERE price_text > '10'` и получил неожиданный набор строк. Как сделать сравнение числовым?
- В `amount_text` суммы записаны как текст, но иногда встречается пустая строка `''`. Запрос `SUM(CAST(amount_text AS int))` падает. Какое выражение чаще всего решает проблему, превращая пустые строки в `NULL` перед приведением типа?
- Все вопросы по «Строки и приведение типов» →