Регулярные выражения и их использование
Регулярные выражения и их использование
А теперь настало время познакомиться с регулярными выражениями.
Предположим, что перед нами стоит задача отыскать в текстовых блоках адрес электронной почты, оканчивающийся на".сот". Как это сделать? Может быть, поискать значок "собака" (@)? Но ведь он может встретиться и в обычном тексте, не являющемся почтовым адресом. Искать подстроку".сот"? Но тогда Flash вывалит в таблицу результатов поиска панели Find and Replace все найденные им интернет-адреса. Что же делать?..
Нам поможет только регулярное выражение. А именно, такое:
.+@.+.com
На первый взгляд, это бессмысленный набор символов, в котором с трудом угадывается нечто знакомое. Чтобы разобраться в нем, напишем таблицу, содержащую описание символов регулярных выражений поиска всех оканчивающихся на".сот" почтовых адресов (табл. 22.1).
Теперь, когда нам все стало ясно, можно опробовать приведенное выше регулярное выражение. Выберем в раскрывающемся списке For панели Find and Replace пункт Text, введем наше регулярное выражение в область редактирования Text и не забудем включить флажок Regular expressions. Ура, работает!
Обобщим сведения, почерпнутые из приведенного примера.
В регулярных выражениях для обозначения различных фрагментов текста используются специальные символы — литералы. Если же нужно найти какой-либо символ, совпадающий с литералом, мы должны будем предварить его символом обратной косой черты (). Например, чтобы найти точку, мы используем последовательность символов ..
С помощью регулярных выражений мы можем выполнять поиск самых разнообразных слов и словосочетаний. Например, регулярное выражение
(multi|hyper)media
совпадает со словами "multimedia" и "hypermedia", но не совпадает со словом "media". Литерал "вертикальная черта" (|) задает поиск либо первой, либо второй подстроки (в нашем случае — либо "multi", либо "hyper"), а скобки здесь использованы для того, чтобы отделить друг от друга две части выражения. Если бы мы их не поставили, получилось бы выражение multi | hypermedia, совпадающее со словами "multi" и "hypermedia", а нам это не нужно.
А вот в выражении
[.!?]$
в квадратных скобках перечислены символы, один из которых должен встретиться в тексте. Это следующие символы: точка (предварена символом , так как является литералом), восклицательный знак и вопросительный знак (предварен обратной косой чертой, так как он тоже литерал). Последний литерал — символ $ — обозначает конец строки. В результате мы получим регулярное выражение, которое ищет один из перечисленных знаков препинания, стоящий в конце строки.
Мы убедились, что при поиске подстрок регулярные выражения очень помогают. Но помогут ли они при замене подстрок? Разумеется!
Предположим, что нам нужно найти адреса электронной почты и в порыве патриотизма заменить в них окончание "сот" на "ru". Для поиска в этом случае мы используем уже знакомое и работающее регулярное выражение
/b(.+@.+.)com
Стоп! Зачем мы взяли часть выражения в скобки? Ведь скобки используются для группировки, т. е. для отделения одной части регулярного выражения от других его частей. Здесь же ничего отделять не нужно — все и так работает.
Дело в том, что Flash, помимо всего прочего, помещает подстроку, совпадающую с заключенной в скобки частью регулярного выражения, в особую переменную, откуда ее потом можно будет извлечь. Таких переменных (иногда говорят — ячеек) предусмотрено девять, и обратиться к их содержимому можно по их номерам. В частности, извлечь содержимое первой ячейки в нашем случае можно так:
$1
Тогда заменить окончание почтового адреса следует с помощью такого регулярного выражения:
$1ru
Как видим, здесь все совсем просто. Мы берем подстроку, найденную первым регулярным выражением, и добавляем к ней окончание "ru".
Можно проверить два приведенных регулярных выражения. Первое нужно набрать в области редактирования Text, верней группы панели Find and Replace, а второе — в области редактирования Text нижней группы. И, конечно же, не забываем включить флажок Regular expressions.
Напоследок осталось привести полный список всех литералов регулярных выражений. Они перечислены в табл. 22.2.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКДанный текст является ознакомительным фрагментом.
Читайте также
23.2. Регулярные выражения
23.2. Регулярные выражения Регулярные выражения, используемые в программах sed, awk, grep, vi, а также во множестве других программ Unix, со временем приобрели большое значение в среде программирования Unix. Регулярные выражения можно применять и при написании программ на языке С. В
23.2.1. Регулярные выражения в Linux
23.2.1. Регулярные выражения в Linux Существуют две разновидности регулярных выражений: базовые регулярные выражения (basic regular expression — BRE) и расширенные регулярные выражения (extended regular expression — ERE). Они соответствуют (в первом приближении) командам grep и egrep. Описание каждой
8.2.2. Учебный пример: регулярные выражения
8.2.2. Учебный пример: регулярные выражения Одним из видов спецификации, который периодически появляется в инструментах Unix и языках сценариев, является регулярное выражение (regular expression, или regexp для краткости). Здесь регулярные выражения рассматриваются как декларативный
8.2.2. Учебный пример: регулярные выражения
8.2.2. Учебный пример: регулярные выражения Одним из видов спецификации, который периодически появляется в инструментах Unix и языках сценариев, является регулярное выражение (regular expression, или regexp для краткости). Здесь регулярные выражения рассматриваются как декларативный
Глава 3. Регулярные выражения
Глава 3. Регулярные выражения Я провела бы его по лабиринту, где тропы орнаментом украшены… Эми Лоуэлл Мощь регулярных выражений как инструмента программирования часто недооценивается. Первые теоретические исследования на эту тему датируются сороковыми годами
Глава 10. Конечные автоматы и регулярные выражения.
Глава 10. Конечные автоматы и регулярные выражения. Существует целый класс проблем, которые могут быть решены с помощью авторучки и бумаги. По-моему, это замечательный аспект программирования: иметь возможность графически представить какой-либо процесс, а затем
Регулярные выражения
Регулярные выражения Теперь снова обратимся к теме, в связи с которой рассматривались NFA-автоматы. Поговорим о регулярных выражениях. Прежде всего, вспомним, что они собой представляют. По существу, регулярные выражения (regular expression) - это мини-язык простого описания
Глава 18. Регулярные выражения
Глава 18. Регулярные выражения Для того, чтобы полностью реализовать потенциал командной оболочки, вам придется овладеть Регулярными Выражениями. Многие команды и утилиты, обычно используемые в сценариях, такие как grep, expr, sed и awk, используют Регулярные
8.2. Команда grep и регулярные выражения
8.2. Команда grep и регулярные выражения С помощью регулярных выражений можно задавать более сложные критерии фильтрации информации. При работе с регулярными выражениями следует заключать шаблон поиска в одинарные кавычки. Это позволит защитить все встречающиеся в нем
9.2.3. Регулярные выражения
9.2.3. Регулярные выражения При изучении возможностей команды grep приводилось большое количество примеров регулярных выражений, поэтому мы не будем еще раз останавливаться не описании их синтаксиса. Ниже, когда будут рассматриваться операторы, вы встретите много примеров
10.3. Регулярные выражения
10.3. Регулярные выражения Редактор sed распознает базовые регулярные выражения, которые мы уже рассматривали в главе 7. Дополнительные особенности появляются только в шаблонах поиска и замены в команде s. С помощью операторов ( и ) можно сохранить до девяти шаблонов поиска