Функции замены в строках
Общие функции строк и функции поиска в строках описаны отдельно.
overlay
Заменяет часть строки input
на другую строку replace
, начиная с 1-индексного offset
.
Синтаксис
Параметры
s
: Строковый тип String.replace
: Строковый тип String.offset
: Целочисленный тип Int (1-индексный). Еслиoffset
отрицательное, оно считается от конца строкиs
.length
: Необязательный. Целочисленный тип Int.length
указывает длину фрагмента внутри входной строкиs
, который будет заменен. Еслиlength
не указан, количество байтов, удаляемых изs
, равно длинеreplace
; в противном случае удаляютсяlength
байтов.
Возвращаемое значение
- Значение типа String.
Пример
Результат:
Результат:
overlayUTF8
Заменяет часть строки input
на другую строку replace
, начиная с 1-индексного offset
.
Предполагается, что строка содержит корректный текст в кодировке UTF-8. Если это предположение нарушено, исключение не генерируется, и результат остается неопределенным.
Синтаксис
Параметры
s
: Строковый тип String.replace
: Строковый тип String.offset
: Целочисленный тип Int (1-индексный). Еслиoffset
отрицательное, оно считается от конца входной строкиs
.length
: Необязательный. Целочисленный тип Int.length
указывает длину фрагмента внутри входной строкиs
, который будет заменен. Еслиlength
не указан, количество символов, удаляемых изs
, равно длинеreplace
; в противном случае удаляютсяlength
символов.
Возвращаемое значение
- Значение типа String.
Пример
Результат:
replaceOne
Заменяет первое вхождение подстроки pattern
в haystack
на строку replacement
.
Синтаксис
replaceAll
Заменяет все вхождения подстроки pattern
в haystack
на строку replacement
.
Синтаксис
Псевдоним: replace
.
replaceRegexpOne
Заменяет первое вхождение подстроки, соответствующей регулярному выражению pattern
(в синтаксисе re2), в haystack
на строку replacement
.
replacement
может содержать подстановки \0-\9
.
Подстановки \1-\9
соответствуют 1-й до 9-й группе захвата (в подшаблоне), подстановка \0
соответствует всему совпадению.
Чтобы использовать символ \
в строках pattern
или replacement
, экранируйте его с помощью \
.
Также имейте в виду, что строковые литералы требуют дополнительного экранирования.
Синтаксис
Пример
Конвертация ISO-датов в американский формат:
Результат:
Копирование строки десять раз:
Результат:
replaceRegexpAll
Как replaceRegexpOne
, но заменяет все вхождения шаблона.
Псевдоним: REGEXP_REPLACE
.
Пример
Результат:
Как исключение, если регулярное выражение действовало на пустой подстроке, замена не выполняется более одного раза, например:
Результат:
regexpQuoteMeta
Добавляет обратную косую черту перед этими символами, имеющими специальное значение в регулярных выражениях: \0
, \\
, |
, (
, )
, ^
, $
, .
, [
, ]
, ?
, *
, +
, {
, :
, -
.
Эта реализация немного отличается от re2::RE2::QuoteMeta. Она экранирует нулевой байт как \0
, а не \x00
, и экранирует только необходимые символы.
Для получения дополнительной информации смотрите RE2
Синтаксис
format
Форматирует строку pattern
с значениями (строки, целые числа и т.д.), перечисленными в аргументах, аналогично форматированию в Python. Строка формата может содержать поля замены, окруженные фигурными скобками {}
. Все, что не содержится в фигурных скобках, считается литературным текстом и копируется в вывод без изменений. Литерал фигурной скобки может быть экранирован двумя скобками: {{ '{{' }}
и {{ '}}' }}
. Имена полей могут быть числами (начиная с нуля) или пустыми (тогда им автоматически присваиваются монотонно возрастающие числа).
Синтаксис
Пример
С неявными номерами:
translate
Заменяет символы в строке s
с помощью соответствия один-к-одному, определенного строками from
и to
.
from
и to
должны быть постоянными строками ASCII.
Если from
и to
имеют одинаковый размер, каждое вхождение 1-го символа from
в s
заменяется на 1-й символ to
, 2-й символ from
в s
заменяется на 2-й символ to
и т.д.
Если from
содержит больше символов, чем to
, все вхождения символов в конце from
, которые не имеют соответствующего символа в to
, удаляются из s
.
Не ASCII-символы в s
не изменяются функцией.
Синтаксис
Пример
Результат:
from
и to
имеют разные длины:
Результат:
translateUTF8
Как translate, но предполагается, что s
, from
и to
являются строками, закодированными в UTF-8.
Синтаксис
Параметры
Возвращаемое значение
- Значение типа String.
Примеры
Запрос:
printf
Функция printf
форматирует заданную строку с указанными значениями (строки, целые числа, числа с плавающей запятой и т.д.), аналогично функции printf в C++. Строка формата может содержать спецификаторы формата, начинающиеся с символа %
. Все, что не содержится в %
и следующем спецификаторе формата, считается литературным текстом и копируется в вывод без изменений. Литерал символа %
может быть экранирован %%
.
Синтаксис
Пример
Запрос: