Перейти к основному содержимому
Перейти к основному содержимому

Функции замены в строках

Общие функции строк и функции поиска в строках описаны отдельно.

overlay

Заменяет часть строки input на другую строку replace, начиная с 1-индексного offset.

Синтаксис

Параметры

  • s: Строковый тип String.
  • replace: Строковый тип String.
  • offset: Целочисленный тип Int (1-индексный). Если offset отрицательное, оно считается от конца строки s.
  • length: Необязательный. Целочисленный тип Int. length указывает длину фрагмента внутри входной строки s, который будет заменен. Если length не указан, количество байтов, удаляемых из s, равно длине replace; в противном случае удаляются length байтов.

Возвращаемое значение

  • Значение типа String.

Пример

Результат:

Результат:

overlayUTF8

Заменяет часть строки input на другую строку replace, начиная с 1-индексного offset.

Предполагается, что строка содержит корректный текст в кодировке UTF-8. Если это предположение нарушено, исключение не генерируется, и результат остается неопределенным.

Синтаксис

Параметры

  • s: Строковый тип String.
  • replace: Строковый тип String.
  • offset: Целочисленный тип Int (1-индексный). Если offset отрицательное, оно считается от конца входной строки s.
  • length: Необязательный. Целочисленный тип Int. length указывает длину фрагмента внутри входной строки s, который будет заменен. Если length не указан, количество символов, удаляемых из s, равно длине replace; в противном случае удаляются length символов.

Возвращаемое значение

  • Значение типа String.

Пример

Результат:

replaceOne

Заменяет первое вхождение подстроки pattern в haystack на строку replacement.

Синтаксис

replaceAll

Заменяет все вхождения подстроки pattern в haystack на строку replacement.

Синтаксис

Псевдоним: replace.

replaceRegexpOne

Заменяет первое вхождение подстроки, соответствующей регулярному выражению patternсинтаксисе re2), в haystack на строку replacement.

replacement может содержать подстановки \0-\9. Подстановки \1-\9 соответствуют 1-й до 9-й группе захвата (в подшаблоне), подстановка \0 соответствует всему совпадению.

Чтобы использовать символ \ в строках pattern или replacement, экранируйте его с помощью \. Также имейте в виду, что строковые литералы требуют дополнительного экранирования.

Синтаксис

Пример

Конвертация ISO-датов в американский формат:

Результат:

Копирование строки десять раз:

Результат:

replaceRegexpAll

Как replaceRegexpOne, но заменяет все вхождения шаблона.

Псевдоним: REGEXP_REPLACE.

Пример

Результат:

Как исключение, если регулярное выражение действовало на пустой подстроке, замена не выполняется более одного раза, например:

Результат:

regexpQuoteMeta

Добавляет обратную косую черту перед этими символами, имеющими специальное значение в регулярных выражениях: \0, \\, |, (, ), ^, $, ., [, ], ?, *, +, {, :, -.

Эта реализация немного отличается от re2::RE2::QuoteMeta. Она экранирует нулевой байт как \0, а не \x00, и экранирует только необходимые символы. Для получения дополнительной информации смотрите RE2

Синтаксис

format

Форматирует строку pattern с значениями (строки, целые числа и т.д.), перечисленными в аргументах, аналогично форматированию в Python. Строка формата может содержать поля замены, окруженные фигурными скобками {}. Все, что не содержится в фигурных скобках, считается литературным текстом и копируется в вывод без изменений. Литерал фигурной скобки может быть экранирован двумя скобками: {{ '{{' }} и {{ '}}' }}. Имена полей могут быть числами (начиная с нуля) или пустыми (тогда им автоматически присваиваются монотонно возрастающие числа).

Синтаксис

Пример

С неявными номерами:

translate

Заменяет символы в строке s с помощью соответствия один-к-одному, определенного строками from и to. from и to должны быть постоянными строками ASCII. Если from и to имеют одинаковый размер, каждое вхождение 1-го символа from в s заменяется на 1-й символ to, 2-й символ from в s заменяется на 2-й символ to и т.д. Если from содержит больше символов, чем to, все вхождения символов в конце from, которые не имеют соответствующего символа в to, удаляются из s. Не ASCII-символы в s не изменяются функцией.

Синтаксис

Пример

Результат:

from и to имеют разные длины:

Результат:

translateUTF8

Как translate, но предполагается, что s, from и to являются строками, закодированными в UTF-8.

Синтаксис

Параметры

  • s: Строковый тип String.
  • from: Строковый тип String.
  • to: Строковый тип String.

Возвращаемое значение

  • Значение типа String.

Примеры

Запрос:

printf

Функция printf форматирует заданную строку с указанными значениями (строки, целые числа, числа с плавающей запятой и т.д.), аналогично функции printf в C++. Строка формата может содержать спецификаторы формата, начинающиеся с символа %. Все, что не содержится в % и следующем спецификаторе формата, считается литературным текстом и копируется в вывод без изменений. Литерал символа % может быть экранирован %%.

Синтаксис

Пример

Запрос: