Примеры регулярных выражений и как их использовать

5 апреля 2021 г.

Регулярное выражение или регулярное выражение определяет шаблон поиска строк в компьютерном программировании. Знание того, как использовать регулярное выражение, может помочь вам найти информацию в любом фрагменте текста. Сопоставление шаблонов в регулярном выражении с шаблонами в тексте чаще всего используется для выполнения поиска и замены, что может быть полезно вам, если вы пишете на компьютере или работаете программистом. Есть также много другие должности которые включают использование регулярных выражений или знание того, как их писать. В этой статье мы определяем, что такое регулярное выражение и каковы его компоненты, а также изучаем примеры и способы их использования.

Что такое регулярное выражение?

Регулярное выражение — это текстовая строка, определяющая шаблон поиска последовательностей в компьютерной программе. Они создаются путем ввода строки текста и символов в определенном порядке. В основном они состоят из букв и того, что обычно называют знаками препинания, такими как тире, скобки и знаки вставки.

Регулярные выражения можно использовать для многих целей, например, для поиска текста и его замены. Программисты используют регулярные выражения для оценки уже созданных ими программ и для оптимизации процесса разработки новых программ. Хотя регулярные выражения могут выглядеть иначе, чем другие последовательности текста, к которым вы, вероятно, привыкли, например, предложение, напечатанное в текстовом процессоре, они полезны для манипулирования текстом или фрагментами текста.

Для разработчиков, которые не умеют писать регулярные выражения, существуют такие программы, как EditPad Pro и RegexBuddy, которые помогают создавать регулярные выражения и объясняют компоненты существующих регулярных выражений.

Компоненты регулярного выражения

Регулярное выражение может содержать несколько компонентов, каждый из которых активирует свою функцию. Вот некоторые общие компоненты регулярного выражения:

  • Квадратные скобки ([ ]): Эти символы обозначают один символ регулярного выражения.

  • Знак вставки внутри квадратных скобок ([^abc]): Эта функция идентифицирует что-то, не включенное в последовательность (здесь не “a”, “b” или “c”).

  • Неведущее, неконечное тире (-): этот символ определяет диапазон в любом регулярном выражении.

  • Обратная косая черта со строчной буквой «b» (\b): эта комбинация указывает на границу слова.

  • Обратная косая черта с заглавной буквой «A» (\A): этот символ обозначает начало строки.

  • Обратная косая черта со строчной буквой «z» (\z): этот символ обозначает конец строки.

  • Вертикальная черта между буквами (x|z): эта функция находит вхождения того или иного значения (здесь «x» или «z»).

Примеры регулярных выражений

Регулярное выражение может быть создано для определенного использования или документа, но есть также регулярные выражения, которые можно применять практически к любому тексту или программе. Вот несколько примеров часто используемых регулярных выражений:

Написание предложения: this\s+is\s+text

Это регулярное выражение вводит пробел в последовательность букв, что приводит к отображению предложения. Здесь символ косой черты с буквой «s» и знаком «плюс» (\s+) указывает программе, что один или несколько символов пробела должны отображаться между другими символами. Следовательно, включение этого регулярного выражения в программу будет отображать предложение: это текст.

Установка диапазона: [a-d1-7]

Это регулярное выражение устанавливает диапазон букв и цифр и сопоставляет их друг с другом. Учитывая числа в этом примере, регулярное выражение будет соответствовать любой букве от «а» до «d» и любому числу от одного до семи. Однако «d1» не считается совпадением и не будет идентифицироваться регулярным выражением.

Получение любого указанного тега HTML: ]*>(.*?)

Это регулярное выражение соответствует парам, которые открывают и закрывают любой HTML-тег. Существует другое выражение, которое работает с определенным тегом HTML, но это регулярное выражение можно использовать с любым тегом HTML без редактирования каких-либо функций или добавления дополнительных сведений.

Удаление пробела после последовательности в текстовом файле: [ \t]+$

Это регулярное выражение можно использовать для удаления ненужных пробелов в текстовом файле, которые появляются после предложений или фраз, таких как лишние пробелы или символы табуляции. Чтобы использовать это регулярное выражение, найдите его в теле текста и «замените» его ничем, чтобы все, что соответствует выражению, в данном случае лишние пробелы, было удалено из файла.

Поиск целых слов: \bresume\b

Это регулярное выражение можно использовать для поиска только целых слов в тексте. Поскольку здесь ищется слово «резюме», выражение будет соответствовать и указывать на любой экземпляр этого слова в тексте, который ищется.

Как использовать регулярное выражение

Существует множество способов и причин использовать регулярное выражение. Многие регулярные выражения используются для поиска точной информации в фрагменте текста или кода. Тем не менее, это четыре наиболее распространенных варианта использования регулярных выражений:

  1. Выполните проверку: подтвердите, что фрагмент текста соответствует определенному шаблону, например, убедитесь, что слово написано правильно в длинном документе или на веб-странице.

  2. Проверка местоположения: найдите фрагменты текста, которые соответствуют уже существующему тексту, например, определите, сколько раз слово появляется в документе или на веб-странице.

  3. Извлечение текста: поиск и удаление небольших фрагментов полного текста, например удаление ненужной статьи из текста после проверки документа или веб-страницы.

  4. Замена старого текста новым текстом. Замените части текста другим текстом, например, напишите заглавными буквами слово, которое неправильно написано с заглавной буквы в документе или на веб-странице.

Советы по использованию регулярного выражения

В то время как большинство регулярных выражений включают в себя различные и конкретные направления для создания и использования, есть несколько общих советов, которые можно применить ко всем регулярным выражениям. Вот несколько советов по созданию и использованию регулярных выражений:

  • Обратите внимание на возврат или включение слишком расплывчатой ​​информации при написании регулярного выражения.

  • Сразу показывать наиболее вероятную альтернативу или альтернативы в выражении.

  • Сведите к минимуму количество циклов, которые должен выполнить двигатель.

  • Выполните выборочную проверку, прежде чем пытаться найти совпадение, особенно если регулярное выражение сложное.

  • Четко определите, какие части регулярного выражения вы решили сделать необязательными, и убедитесь, что хотя бы одна часть не является опциональной.

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *